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在 过 去 的 十 年 里 ，VLSI 设 计 技 术 ， 特 别 是 CAD 产业 ， 以 异常 迅猛 的 速度 发 展 。 这 种 快速 
的 进展 使 得 产业 界 能 在 更 短 的 时 间 内 设计 和 制造 出 复杂 的 专用 集成 电路 和 系统 。 本 书 综述 了 系 
统 设计 的 基本 概念 ， 并 提出 了 软件 和 硬件 系统 设计 方法 学 的 原理 。 可 帮助 投身 于 电子 系统 设计 
的 人 士 跟 上 时 代 的 步伐 。 


本 书 特点 
© 提出 系统 设计 中 的 基本 问题 ， 讨 论 各 种 可 用 于 捕获 系统 行为 及 其 实现 的 概念 模型 
e 研究 用 来 描述 系统 功能 性 的 语言 ， 以 及 通过 模拟 验证 系统 功能 的 各 种 问题 


© 为 系统 划分 、 评 估 及 模型 细 化 等 提供 了 算法 和 技术 的 综述 
e 将 以 上 所 有 的 主题 结合 起 来 ， 使 之 成 为 一 个 具有 一 致 性 的 设计 方法 ， 其 中 还 包括 对 系统 


设计 的 通用 环境 的 讨论 





| a ‘Lp, 教授 于 宾夕法尼亚 大 学 费城 分 校 获得 博士 学 位 。 他 有 十 几 年 
= Daniel D. Gajski 的 从 事 数 字 电 路 、 交 换 系统 ， 巨 型 计算 机 设计 以 及 在 VLSI 结 
作 | 构 领 域 的 从 业经 历 。 此 后 又 在 伊利 诺 伊 大 学 厄 巴 纳 - 尚 佩 恩 分 校 计算 机 科学 系 从 事 了 10 年 的 学 
各 | 术 研究 。 目 前 他 是 加 州 大 学 艾 尔 温 分 校 信息 与 计算 机 科学 系 、 电 子 与 计算 机 工程 系 的 教授 。 他 
介 | 出 版 过 多 部 专著 。 他 的 研究 方向 为 嵌入 式 系统 与 信息 技术 、 设 计 方法 学 与 e 设 计 环 境 、 系 统 描 
| 述 语言 及 CAD 软 件 、 设 计 科学 。 

主 | 边 计 年 清华 大 学 计算 机 系 教授 博士 生 导师 。1970 年 毕业 于 清华 大 学 自动 控制 系 , 毕业 
要 JL 小” 后 在 清华 大 学 任教 至 今 他 出 版 过 多 部 专著 和 译 著 。 研究 方向 为 片上 系统 (SOC) 
5 | 的 系统 设计 方法 ， 包 括 系统 描述 、 软 硬件 划分 与 通信 综合 、 与 布 图 结合 的 高 层次 综合 、 系 统 协 
各 | 同 设计 与 验证 等 . 
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本 书 介绍 能 人 式 系 统领 域 的 基本 概念 以 及 实际 的 描述 和 设计 方法 ,包括 骨 人 式 系统 设计 的 
模型 和 体系 结构 ,描述 语言 .系统 划分 .设计 质量 评估 .描述 细 化 以 及 系统 级 方法 学 等 方面 。 讲 
解 详细 ,实例 丰富 ,有 和 针对 性 地 介绍 了 阁 干 着 名 算法 或 解法 ,并 解释 每 种 方法 的 优 缺 点 ,还 包括 
对 该 领域 其 他 工作 的 综述 ,并 提出 尚未 解决 的 一 些 问题 。 本 书 适合 从 事 棕 入 式 系统 设计 和 人 研究 
的 工程 技术 人 员 .科研 人 员 .高 等 院 校 计算 机 和 电子 信息 工程 专业 的 本 科 生 和 研究 生 。 

Authorized. translation from the English language edition entitled Specification and Design of 
Embedded Systems by Daniel D. Gajski, Frank Vahid, Sanjiv Narayan, Jie Gong, published by pear- 
son Education, Inec.. publishing as Prentice-Hall (ISBN 0-13-150731-1) , Copyright © 1994 by 
Daniel D. Gajski, Frank Vahid, Sanjiv Narayan, Jie Gong. 

All rights reserved. No part of this book may be reproduced or transmitted in any form or by any 
means, electronic or mechanic, including photocopying, recording, or by any information storage re- 
tneval system, without permission of Pearson Education, Inc. 

Chinese Simplified language edition published by China Machine Press. 
Copyright © 2005 by China Machine Press. 


本 书 中 文 简体 字 版 由 美国 Pearson Education 培 生 教育 出 版 集团 授权 机 械 工业 出 版 社 独家 出 
版 。 未 经 出 版 者 书面 许可 ,不 得 以 任何 方式 复制 或 抄 获 本 书 内 容 。 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 驭 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 璧 
划 了 研究 的 范畴 ， 还 揭 葬 了 学 术 的 源 变 ， 妍 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流 提 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 得 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 
设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 图 文 信息 有 限 公司 较 早 意识 到 “出 版 要 为 教育 服务 "。 目 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 
Prentice Hall, Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 甄选 出 Tanenbaum，Stroustrup ，Kernighan ， 
Jim Gray 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 谈 痢 学 习 、 人 赋 
究 及 朗 藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 从 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 囊 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指 导 ， 还 不 辞 劳 苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专 诚 为 其 书 的 中 译本 作 序 。 迄 今 , “计算 机 科学 丛书 ”已 经 出 版 了 近 百 个 
品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书籍 ， 为 
进一步 推广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 人 一 个 新 的 阶段 。 为 此 ， 华章 公司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 : 除 “ 计 算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “经 典 原 版 书库 ”; 同时 ， 引 进 全 美 通行 的 教学 辅导 书 “Schaum’s Outines” 系 列 组 成 
“全 美 经 典 学 习 指 导 系 列 ”。 为 了 保证 这 三 套 从 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公司 聘 请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 学 、 上 
海 交通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科 技 大 学 、 了 哈尔滨 工业 大 学 、 西 安 交 通 大 党、 中国 
人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮 电大 学 、 中 山大 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 潮 
北 工学 院 、 中 国 国家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 著名 学 者 组 成 “专家 指导 委员 会 ”>， 为 我 们 提供 选 题 意 见 和 出 版 监督 。 

这 三 套 从 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 








的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. L T., Stanford, U.C. Berkeley, C. M. U. 等 世界 
名 牌 大 学 所 采用 。 不 仅 涵 盖 了 程序 设计 、 数 据 结构 、 操 作 系 统 、 计 算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工程 、 图 形 学 、 通 信和 与 网 络 、 离 散 数 学 等 国内 大 学 计算 机 专业 普遍 开设 的 核 
心 课程 ， 而 且 各 具 特 色 一 一 有 的 出 自 语言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 训 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采用 。 在 这 些 圆 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 
宫殿 中 由 登 党 而 人 宣 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服 务 的 起 点 。 华 章 公 司 欢 迎 老 师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 : hzedu@hzbook.com 

联系 电话 : (010 ) 68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 
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多 年 来 ,半导体 制造 技术 持续 迅速 发 展 ,芯片 规模 的 增 大 使 得 集成 电路 的 应 用 范围 也 在 迅速 
扩大 ,已 经 渗透 到 各 行 各 业 , 在 机 械 系统 和 其 他 系统 中 广泛 使 用 ,形成 所 谓 骨 入 式 系统 。 岩 入 式 
系统 深入 到 人 类 活动 的 几乎 所 有 方面 。 从 和 我 们 日 常生 活 密切 相关 的 手机 ,个 人 数字 助理 
(PDA) .音响 设备 ,高 清晰 度 电视 .游戏 机 ,到 公共 场所 常见 的 汽车 电子 设备 .通信 设备 .电子 医疗 
设备 ,再 到 特殊 领域 ,如 军事 .航天 \ 水 下 等 使 用 的 电子 设备 ,内 人 式 系统 无 时 无 刻 不 在 发 挥 着 重 
要 作用 并 将 继续 扮演 越 来 越 重要 的 角色 。 同 时 ,片上 系统 (SOC) 应 运 而 生 ,在 一 个 芯片 上 可 以 同 
时 集成 微 处 理 器 ,存储 器 .专用 电路 .输入 输出 电路 ,模拟 电路 ,甚至 射频 电路 和 微机 械 。 

我 们 已 经 有 了 相当 多 有 关 逻 辑 综合 .布局 ,布线 等 方面 的 工具 。 在 目标 系统 的 规模 不 断 增 
大 .功能 日 益 复杂 的 情况 下 ,传统 的 设计 方法 学 已 经 越 来 越 不 适应 这 种 变化 ,迫切 需要 从 更 高 
的 层次 上 重新 审视 和 研究 数字 系统 的 设计 方法 学 问题 。 本 书 作 者 提出 的 设计 理念 是 ,在 设计 
早期 的 更 抽象 的 高 层次 上 开始 ,进行 系统 级 设计 。 首 先 ,在 高 层次 上 的 设计 有 助 于 更 好 地 理解 
系统 的 功能 ,保证 设计 的 正确 性 。 其 次 ,在 高 层次 上 的 决策 对 整个 设计 的 影响 更 大 ,因而 ,早期 
的 正确 决策 将 得 到 更 大 的 回报 。 由 于 在 系统 级 引入 优化 策略 ,可 以 在 各 种 设计 选择 中 寻求 最 
好 的 解决 方案 ,因而 可 以 预期 基于 这 种 新 的 方法 学 会 设计 出 更 加 有 竞争 力 的 产品 。 

本 书 是 一 本 很 好 的 介绍 能 人 式 系统 描述 和 设计 技术 的 教科 书 。 作 者 根据 多 年 的 研究 经 验 
和 成 果 , 既 系统 地 介绍 基本 概念 ,又 介绍 实际 的 描述 和 设计 方法 。 本 书 几 乎 论述 了 艇 人 式 系统 
设计 的 所 有 方面 ,包括 模型 和 体系 结构 .描述 语言 .系统 划 分 、 设 计 质 量 评估 、 描 述 细 化 以 及 系 
统 级 方法 学 等 。 而 且 , 对 于 每 章 涉及 的 每 个 问题 ,作者 都 予以 详细 地 讲解 并 给 出 大 量 的 实例 。 
本 书 对 于 初学 者 和 相关 领域 的 从 业 人 员 来 说 ,是 一 本 很 好 的 人 门 书 ,而 对 于 从 事 戏 人 式 系统 设 
计 和 研究 的 工程 技术 人 员 ,科研 人 员 和 高 等 院 校 的 本 科 生 和 研究 生 又 是 一 本 很 详尽 的 参考 书 。 
据 我 们 所 知 , 本 书 已 在 全 世界 很 多 大 学 中 作为 教材 或 参考 书 ,具有 最 高 的 采用 率 。 

本 书 虽 出 版 于 1994 年 ,但 其 基本 的 思想 和 方法 仍然 是 嵌入 式 系统 设计 的 指导 思想 和 理论 
基础 。 本 书 介绍 的 描述 语言 ,作者 在 后 来 又 有 所 改进 ,并 改称 为 SpecC。 除 美国 外 ,还 有 日 本 
和 加 拿 大 等 许多 国家 都 在 研究 和 推广 这 种 系统 描述 语言 。 

进入 2000 年 以 来 ,在 国家 的 大 力 支 持 和 推动 下 ,我 国 在 戏 和 人 式 系统 和 片上 系统 SOC 的 研 
究 与 开发 领域 出 现 了 前 所 未 有 的 好 势头 。 我 们 向 读者 介绍 这 本 书 ,相信 对 我 国 集成 电路 工业 
和 技术 的 发 展会 发 挥 一 定 作 用 。 

本 书 是 许多 老师 同学 共同 努力 的 结晶 。 吴 为 民 译 第 1 BS, KURA 2 章 , 王 海 力 译 第 3 
& , 王 迪 译 第 4 章 和 附录 A, ERE 5 章 , 童 琨 译 第 6.9 章 , 赵 康 、 林 锋 译 第 7 章 , 王 云 峰 、 
赵 建 洲 译 第 8 章 。 边 计 年 和 吴 为 民 分 别 对 所 有 翻译 初稿 进行 了 仔细 的 审 校 和 修改 ,最 后 由 边 
计 年 统 稿 定稿 。 对 于 有 些 术语 ,国内 出 现 不 同 的 说 法 ,我 们 根据 全 国 科 学 技术 名 词 审 定 委员 会 
公布 的 《计算 机 科学 技术 名 词 》 和 自己 的 理解 决定 取舍 。 虽 然 我 们 的 宗旨 是 准确 表达 原文 的 意 
思 , 但 鉴于 译 者 水 平和 时 间 所 限 ,错误 和 不 足 在 所 难免 , 望 读者 不 音 指 正 。 : 

译 者 
2005 年 1 月 





基本 原理 


在 过 去 的 十 年 里 ,VLSI 的 设计 技术 特别 是 CAD 产业 取得 了 很 大 成 功 ,与 IC 制造 技术 同 
步 以 异常 迅猛 的 速度 发 展 。 与 高 抽象 层次 相 比 ,低层 次 的 设计 问题 更 早 地 变 得 难 解 和 费时 。 
因此 ,学 术 界 和 产业 界 都 被 迫 将 注意 力 首 先 投向 诸如 电路 模拟 布局 布线 及 布 图 规划 等 问题 。 
当 这 些 问题 变 得 易于 处 理 时 , 便 成 功 地 开发 出 用 于 逻辑 模拟 和 综合 的 CAD 工具 ,并 将 其 引入 
到 设计 过 程 中 。 随 着 设计 复杂 性 的 大 幅度 提高 和 产品 进入 市 场 时 间 要 求 的 大 幅度 缩短 ,产业 
界 和 学 术 界 都 开始 关注 比 逻辑 级 和 布局 级 更 高 级 别 的 设计 问题 。 由 于 高 层次 的 抽象 使 设计 者 
需要 考虑 的 对 象 数目 降低 了 一 个 数量 级 ,也 就 允许 产业 界 能 够 在 更 短 的 时 间 内 设计 和 制造 出 
复杂 的 专用 集成 电路 (ASIC)。 

WP BERS ZI ,行为 综合 也 在 设计 方法 学 中 发 挥 了 提高 抽象 级 别 的 作用 。 行 为 综合 是 
用 于 设计 单个 专用 集成 电路 的 。 当 设计 方法 学 要 求 更 高 的 抽象 级 别 时 ,这 些 专用 集成 电路 和 
标准 处 理 器 及 内 存 一 起 被 用 做 系统 的 组 件 。 系 统 级 的 设计 方法 学 关注 系统 描述 以 及 从 描述 到 
一 组 互联 组 件 的 变换 和 细 化 。 系 统 描述 依据 执行 于 抽象 数据 类 型 上 的 计算 ,而 变换 和 细 化 则 
包括 针对 标准 处 理 器 进行 软件 编译 和 根据 定制 的 组 件 进行 硬件 综合 。 但 在 这 一 点 上 ,虽然 已 
有 若干 年 系统 制造 的 历史 ,尽管 有 明确 的 需求 ,产业 界 和 学 术 界 并 未 对 系统 级 设计 方法 学 的 发 
展 和 形成 给 予 充 分 关注 。 为 解决 复杂 性 问题 和 缩短 设计 周期 ,产业 界 最 近 已 开始 关注 于 建立 
一 个 一 致 性 的 系统 级 设计 方法 学 。 

强调 更 抽象 化 和 系统 级 方法 学 的 主要 原因 是 基于 这 样 一 个 事实 :高 层次 抽象 更 接近 设计 
者 的 日 常 思维 习惯 。 比 如 ,难以 想像 设计 者 仅 靠 电路 原理 图 如 何 能 够 对 一 个 由 10 万 个 门 或 
10 万 个 布尔 表达 式 组 成 的 系统 设计 进行 描述 、 建 立 文档 及 进行 交流 。 系 统 越 复杂 , 当 设 计 者 
用 电路 级 .逻辑 级 .寄存 器 级 原理 图 对 其 进行 描述 时 ,就 越 会 产生 功能 理解 上 的 困难 。 玉 一 方 
面 , 当 系 统 被 描述 成 操作 于 抽象 数据 类 型 上 的 一 系列 复杂 计算 ,并 且 通 过 抽象 通道 进行 通信 
时 ,设计 者 将 发 现 这 更 易于 描述 和 验证 特定 的 功能 ,更 易于 采用 不 同 技术 对 各 种 实现 进行 评 
fk o 

必须 承认 ,对 系统 级 设计 的 研究 虽 已 有 很 多 年 ,但 目前 仍 在 相当 程度 上 局 限于 特定 领域 和 
团体 。 例 如 ,计算 机 体系 结构 界 考虑 的 是 将 计算 和 算法 映射 到 不 同体 系 结构 的 方法 。 体 系 结 
构 可 以 是 脉动 阵列 、 超 立方 体 、 多 处 理 器 以 及 大 规模 并 行 处 理 嚣 。 软 件 工 程 界 则 一 直 在 人 研究 软 
件 代码 的 描述 和 设计 方法 。CAD 界 集 中 于 接口 综合 .内存 管理 、 系 统 描 述 捕 提 以 及 设计 空间 
探索 等 系统 问题 。 但 是 ,很 多 问题 仍 悬 而 未 决 ,其 中 最 重要 的 是 缺乏 一 个 得 到 普遍 接受 的 理论 
框架 和 支持 系统 设计 方法 学 的 CAD 环境 。 尽 管 有 这 些 悬 而 未 决 的 问题 ,系统 设计 技术 也 已 成 
熟 到 一 定 程 度 。 因 此 ,用 一 本 书 对 发 展 至 今 的 基本 概念 和 成 果 进 行 总 结 ,希望 会 对 系统 设计 领 
域 的 学 生 和 从 业者 有 所 帮助 。 在 本 书 中 ,我 们 力图 涵盖 多 种 研究 项 目的 思想 和 成 果 。 由 于 这 
个 领域 还 比较 年 轻 ,我 们 仍 可 能 忽略 了 某 些 很 有 趣 和 有 益 的 项 目 , 为 此 我 们 在 此 表示 儿 意 ,并 
希望 得 到 这 些 技术 的 信息 ,以 便 将 它们 结合 到 将 来 的 版 本 中 。 同 样 , 由 于 各 种 原因 ,我 们 也 没 
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能 在 本 书 中 详细 地 论 及 系统 级 的 大 干 重要 问题 ,包括 形式 验证 、 测 试 设计 以 及 协同 模拟 。 尽 管 
如 此 ,我 们 相信 ,一 本 有 关系 统 级 描述 和 设计 的 书 将 有 助 于 电子 系统 设计 自动 化 (ESDA) 在 未 
来 的 发 展 和 繁荣 。 
读者 

本 书面 向 计算 机 科学 和 工程 界 的 三 类 读者 。 首 先 , 它 会 吸引 系统 设计 者 和 工程 管理 者 , 因 
为 他 们 会 对 ASIC 和 系统 设计 方法 学 、 软 硬件 协同 设计 以 及 设计 过 程 管理 感 兴趣 。 其 次 ,该 书 
也 可 以 被 CAD 工具 的 开发 者 所 利用 ,他 们 会 采用 该 书 中 所 给 出 的 现存 或 未 来 工具 中 的 一 些 概 
念 进 行 系统 描述 捕捉 设计 空间 探索 以 及 系统 建 模 和 细 化 。 最 后 ,由 于 该 书 综述 了 系统 设计 的 
基本 概念 ,提出 了 包括 软件 和 硬件 在 内 的 系统 设计 方法 学 的 原理 ,因此 ,对 于 一 门 高 年 级 本 科 
或 研究 生 课程 来 说 ,该 书 也 是 有 价值 的 。 该 课程 可 针对 有 志 于 计算 机 体系 结构 .设计 自动 化 和 
/或 软件 工程 的 学 生 。 


本 书 的 组 织 


本 书 组 织 成 9 章 , 分 为 四 个 部 分 。 第 1.2 章 提出 系统 设计 的 一 些 基本 问题 ,讨论 了 可 用 于 
系统 行为 捕获 和 实现 的 各 种 概念 模型 。 第 3、4、5 章 论 及 用 于 描述 系统 功能 性 的 语言 ,还 涉及 
通过 模拟 验证 系统 功能 性 的 各 种 问题 。 第 6.7、8 章 提供 了 一 个 有 关系 统 划 分 、 评 估 和 模型 细 
化 的 算法 和 技术 的 综述 。 第 9 章 将 所 有 这 些 主题 结合 成 一 个 一 致 性 的 设计 方法 学 ,包括 对 系 
统 设计 通用 环境 的 讨论 。 | 

在 对 第 1.2 章 所 定义 概念 理解 的 前 提 下 ,每 一 章 都 是 独立 的 ,可 以 单独 阅读 。 本 书 每 一 章 
都 采用 了 相同 的 写作 风格 和 组 织 方法 。 典 型 的 一 章 包含 了 介绍 性 的 例子 ,定义 了 基本 概念 , 阐 
述 了 要 解决 的 主要 问题 。 针 对 所 提出 的 问题 ,每 一 章 还 描述 了 若干 著名 的 算法 或 解法 ,并 解释 
每 种 方法 的 优 缺 点 。 每 一 章 还 包括 对 该 领域 其 他 工作 的 一 个 小 综述 ,以 及 对 发 展 方 回 的 讨论 。 

在 每 章 的 末尾 ,我们 还 给 出 若干 练习 ,分 为 三 类 :家 庭 作业 类 问题 ,项 目 类 问题 ,以 及 课题 
类 问题 。 家 庭 作业 类 问题 旨 在 检测 读者 对 每 章 基 本 内 容 的 理解 。 项 目 类 问题 用 一 个 星 标记 。 
为 解决 项 目 类 问题 ,读者 需要 在 对 一 些 文献 进行 研究 的 基础 上 才能 对 题目 有 更 深入 的 理解 。 
这 类 问题 可 能 需要 学 生 用 若干 星期 时 间 来 完成 。 课 题 类 问题 用 两 个 星 标记 ,是 尚未 解决 的 问 
题 , 若 深入 研究 ,将 是 不 错 的 硕士 或 博士 学 位 论文 谋 题 。 

本 书 可 用 于 两 种 不 同 的 课程 。 一 种 可 侧重 于 系统 描述 、 建 立 文档 以 及 验证 方面 , 跳 过 第 
6、7、8 章 中 的 算法 部 分 。 另 一 种 课程 ,侧重 设计 方法 学 和 设计 空间 探索 技术 , 跳 过 语言 和 模拟 
方面 的 内 容 。 无 论 采 用 哪 种 课程 ,我 们 认为 本 书 都 会 有 助 于 填补 计算 机 科学 与 工程 谋 程 中 的 
一 个 空白 , 即 除了 涵盖 电路 设计 、 远 辑 设计 以 及 计算 机 体系 结构 的 内 容 , 还 讲述 了 系统 设计 技 
术 。 

我 们 希望 本 书 的 内 容 选择 和 写作 风格 接近 您 的 期 望 。 我 们 欢迎 您 的 意见 和 建议 。 


Daniel Gajski, Frank Vahid, Sanjiv Narayan, Jie Gong 
加 州 大 学 艾 尔 温 分 校 
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第 1 章 5| 言 


在 过 去 的 20 年 里 ,设计 一 个 系统 所 需 经 过 的 实际 步骤 没有 实质 性 的 变化 。 男 一 方面 ,各 
设计 步骤 的 侧重 点 却 有 了 显著 变化 ;由 于 较 后 的 阶段 已 或 多 或 少 地 实现 了 自动 化 ,设计 者 越 来 
越 关注 于 系统 设计 过 程 较 早期 的 更 抽象 阶段 。 这 种 关注 点 的 转换 使 设计 者 能 够 在 更 短 的 时 间 
内 设计 出 印加 复杂 的 系统 。 设 计 这 样 的 复杂 系统 ,达到 功能 正确 性 要 比 达到 芯片 面积 或 程序 
所 占 内 存 最 小 化 要 重要 且 复 杂 得 多 。 系 统 的 功能 性 在 早期 的 设计 步骤 中 能 得 到 最 好 的 理解 ， 
此 时 很 多 的 实现 细节 还 没有 被 加 入 。 这 就 是 为 什么 在 系统 设计 过 程 中 早期 的 阶段 至 关 重 要 。 

在 本 章 中 ,我 们 将 从 多 种 角度 着 重 探究 这 种 关注 点 的 转变 。 我 们 将 描述 系统 设计 的 相关 
步 又、 设计 表示 的 分 类 各 步骤 的 抽象 层次 ,给 出 曾 有 的 关注 点 及 其 如 何 转变 的 历史 ,描述 下 一 
次 可 能 会 向 系 统 级 的 转变 ,以 及 在 系统 级 所 需 的 工具 和 方法 学 。 


1.1 设计 表示 


对 任何 特定 的 产品 ,设计 过 程 通常 开始 于 对 产品 功能 的 概念 化 ,结束 于 对 产品 制造 蓝图 的 
制订 。 在 设计 完成 之 前 ,很 多 不 同 的 人 员 会 参与 其 间 。 | 

例如 ,需要 市 场 部 门 研究 市 场 需求 和 确定 对 新 产品 的 要 求 。 需 要 一 个 首席 设计 师 将 这 些 
要 求 转换 为 产品 的 体系 结构 。 技 术 专 家 介入 选 择 采用 的 工艺 可 能 需要 的 组 件 和 供应 者 ,而 负 
责 计 算 机 辅助 设计 和 计算 机 辅助 软件 工程 的 小 组 必须 获得 或 开发 出 支持 产品 各 部 分 设计 的 工 


具 。 负 责 设 计 的 小 组 将 制订 出 蓝图 ,指明 如 何 从 可 获得 的 并 采用 了 所 选 工艺 的 组 件 来 制造 出 


产品 。 软 件 工程 师 将 为 产品 所 采用 的 处 理 器 编写 代码 。 测 试 工程 师 需要 制定 测试 策略 和 测试 
向 量 以 确定 产品 的 可 靠 性 ,而 制造 工程 师 则 需要 为 产品 的 实际 制造 定义 机 器 操作 和 制定 工厂 
生产 进度 表 。 

每 个 小 组 都 是 从 各 自 的 角度 看 待产 品 ,需要 特定 的 信息 支持 其 特定 的 工作 。 这 样 ,每 个 产 
品 、 进 而 每 个 设计 ,必然 有 若干 个 不 同 的 表示 或 视角 ,侧重 于 不 同类 型 的 信息 。 对 于 单一 的 表 
示 也 是 这 样 , 这 时 随 着 设计 的 周期 进展 可 获得 不 同 层次 的 细节 。 

3 种 最 常 采用 的 表示 法 分 别针 对 产品 的 行为 、 结 构 和 物理 方面 。 

行为 表示 “将 设计 简单 地 看 做 黑 盒 ,并 将 其 行为 描述 为 输入 值 和 终止 时 间 的 函数 。 换 名 
话说 ,行为 表示 描述 系统 的 功能 性 ,但 不 涉及 任何 实现 。 行 为 表示 定义 了 黑 盒 如 何 对 输入 值 的 
任何 组 合 做 出 响应 ,但 不 提供 关于 如 何 设计 这 个 黑 盒 的 任何 指示 。 

结构 表示 “与 行为 表示 比较 而 言 ,开始 解答 一 些 设计 问题 ,因为 结构 表示 将 黑 盒 定义 成 一 
组 组 件 及 其 互联 关系 。 换 句 话说 ,结构 表示 着 重 于 描述 产品 的 实现 。 虽 然 黑 盒 的 功能 性 可 从 
互联 的 组 件 中 得 出 ,但 并 不 明确 描述 功能 性 。 

物理 表示 “承载 了 设计 的 更 进一步 的 实现 ,以 结构 化 表示 描述 了 组 件 的 特点 。 例 如 ,物理 
表示 会 提供 每 个 组 件 的 尺寸 和 位 置 ,以 及 组 件 之 间 互 联 的 物理 特性 。 这 样 ,结构 表示 提供 了 设 
计 的 互联 性 ,而 物理 表示 则 描述 了 互联 组 件 之 间 的 空间 关系 ,描述 了 被 制造 设计 系统 的 重量 、 
”大 小 散热 . 功 耗 以 及 每 个 输入 输出 引 肢 的 位 置 。 
一 般 来 说 ,设计 系统 的 过 程 应 遵循 从 行为 表示 到 结构 表示 再 到 物理 表示 的 路 线 , 并 沿 此 路 
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线 逐 渐 获 得 实现 细节 。 如 上 所 述 ,虽然 我 们 需要 这 些 实现 细节 来 制造 产品 ,但 这 些 细节 也 会 引 
起 系统 功能 性 的 模糊 ,阻碍 了 设计 者 确保 系统 正常 工作 的 努力 。 举 一 个 例子 :考虑 一 个 能 做 
32 位 数字 加 减 的 简单 系统 。 行 为 表示 仪 包 含 两 个 等 式 :a := a +65 和 4a:= a X65。 而 结构 表示 
则 可 能 包含 夫 干 互联 的 寄存 器 、 算 术 单 元 以 及 多 路 选择 器 ,使 得 系统 功能 性 难以 辨别 ,尤其 组 
件数 量 很 多 或 者 某 组 件 的 功能 仅 被 部 分 使 用 时 更 是 如 此 。 因 此 ,如 果 要 强调 功能 正确 性 这 个 
正在 不 断 变 成 至 关 重 要 的 问题 ,我们 就 应 该 浊 认 : 当 工 作 于 行为 表示 而 不 是 工作 于 结构 或 物理 
表示 时 ,设计 者 将 会 更 成 功 从 而 设计 出 更 好 的 产品 。 


1.2 抽象 级 别 


在 前 一 部 分 中 ,我 们 描述 了 最 常见 的 几 种 设计 表示 类 型 ,即行 为 结构 和 物理 表示 。 到 此 ， 
我 们 可 以 进入 下 一 个 阶段 ,并 注意 到 在 电子 系统 的 设计 中 ,每 种 表示 类 型 适合 于 硅 干 不 同 的 抽 
象 级 别 或 者 粒度 。 不 同 的 抽象 级 别 基于 它们 所 使 用 的 对 象 类 型 进行 区 分 , 归 入 四 类 :晶体 管 
级 门 级 .寄存 器 级 和 处 理 器 级 。 在 图 1-1 中 总 结 了 这 些 不 同 的 抽象 级 别 与 各 种 表示 类 型 的 关 
系 。 








级 别 行为 表示 结构 组 件 物理 对 象 
BAS 。 ”微分 方程 ,电流 - 电压 关系 图 AE, LBA 模拟 和 数字 单元 
门 布尔 方程 ,有 限 状态 机 门 ,触发 器 模块 ,元 件 
寄存 器 。“ 算法 ,流程 图 ,指令 集 ,广义 有 限 ”加 法 器 , 比较 器 , 寄存 器 , 计数” 微 芯片 ,专用 集成 电路 
状态 机 器 ,寄存 器 文件 ,队列 
处 理 器 。” ”可 执行 描述 程序 处 理 器 ,控制 器 ,存储 器 ,专用 集 ”印刷 电路 板 , 多 芯片 模块 
成 电路 


图 1-1 设计 表示 和 抽象 级 别 

根据 图 1-1, 在 晶体 管 级 的 主要 组 件 是 晶体 管 . 电 阻 和 电容 。 这 些 对 象 可 组 合 起 来 ,形成 
满足 给 定 功 能 的 模拟 电路 和 数字 电路 。 在 该 级 别 上 ,功能 通常 用 一 组 微分 方程 或 者 某 类 电 
流 一 电压 关系 描述 。 最 后 ,这 样 一 种 电路 的 物理 表示 , 称 为 单元 ,将 包含 品 体 管 级 元 件 和 它们 
之 间 的 连 线 。 这 种 单元 通常 根据 它们 所 包含 元 件 的 版 图 来 定义 。 

在 门 级 ,主要 的 元 件 是 逻辑 门 和 触发 器 。 逻 辑 门 是 用 于 执行 布尔 运算 的 特殊 电路 ,如 “或 ” 
和 “与 ”。 触 发 器 是 基本 存储 单元 ,每 个 仅 能 存储 一 位 信息 。 这 些 门 和 触发 器 表示 典型 的 数字 
单元 。 可 将 这 些 独 立 组 件 结合 起 来 ,安置 在 硅 片 表面 ,以 构成 算术 和 存储 模块 ,其 行为 可 通过 
逻辑 方程 和 有 限 状 态 机 图 描述 。 

在 寄存 器 级 的 主要 元 件 是 由 门 和 触发 器 ,如 加 法 器 、 比 较 器 、 多 路 选择 器 、. 计数器 寄存 器 、 
寄存 器 文件 数据 缓冲 器 和 队列 设计 而 成 的 算术 和 存储 单元 。 每 个 寄存 器 级 元 件 是 一 个 物理 
对 象 , 具 有 固定 尺寸 .固定 传播 时 间 , 并 且 在 模块 边界 上 其 输入 和 输出 有 固定 位 置 。 寄 存 带 级 
元 件 可 用 于 微 芯 片 设计 ,该 设计 可 用 流程 图 、 指 令 集 、 广 义 有 限 状 态 机 或 状态 表 描 述 。 

最 后 ,最 高 抽象 级 别称 为 处 理 器 级 ,因为 该 级 别 的 基本 组 件 是 处 理 器 、 硝 储 器 、 控 制 器 、 接 
口 ,以 及 称 为 专用 集成 电路 (application-specific integrated circuit，ASIC) 的 定制 微 蕊 片 。 一 个 
或 多 个 这 样 的 组 件 可 安置 于 一 个 印刷 电路 板 (printed-circuit board, PCB) 上 , 微 芯 片 焊 接 于 其 
上 ,并 通过 印 制 于 板 上 的 导线 连接 起 来 。 为 降低 板 的 尺寸 ,可 用 硅 基 片 代 替 PCB 用 于 微 芯片 
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的 连接 ,这 种 情况 下 的 封装 称 为 多 芯片 模块 (multi-chip module,MCM)。 由 处 理 器 级 组 件 组 合 


而 成 的 系统 可 用 若干 种 不 同 的 方式 描述 其 行为 :如 采用 自然 语言 ,采用 以 硬件 描述 语言 方式 的 
可 执行 描述 ,或 者 采用 并 法 或 程序 设计 语言 程序 。 

现在 ,重要 的 是 记 住 这 样 一 个 事实 ,设计 者 只 能 将 他 们 的 努力 关注 于 他 们 所 能 理解 的 系统 
级 别 上 ,这 个 级 别 很 大 程度 上 决定 于 需要 确保 对 象 数量 相对 小 。 例 如 ,一 个 设计 者 可 能 理解 一 
个 包含 10 个 布尔 方程 的 系统 ,但 肯定 不 能 理解 一 个 包含 1 万 个 方程 的 系统 。 在 后 一 种 情况 
下 ,他 将 不 得 不 向 高 抽象 级 别 转移 直至 达到 系统 能 表示 成 可 管理 的 对 象 数量 ,如 表示 成 10 个 
算法 。 在 较 低 抽象 层次 上 ,只 有 当 我 们 将 系统 划分 为 小 块 并 在 许多 设计 者 中 分 配 时 ,或 者 当 我 
们 采用 自动 工具 建造 它 时 ,系统 才 是 可 管理 的 。 幸 运 的 是 , 随 厦 新 的 在 较 低 层次 上 的 设计 工具 
出 现 ,设计 者 能 自由 地 关注 于 高 级 别 ,而 在 高 级 别 做 出 决策 要 比 在 较 低 级 别 对 质量 的 影响 大 得 
多 。 
每 个 电子 系统 在 经 历 从 概念 化 到 制造 的 设计 过 程 中 ,不 可 避免 地 要 经 过 大 部 分 这 些 抽象 
级 别 。 在 设计 过 程 中 的 这 组 特定 任务 ,它们 执行 的 特定 顺序 和 每 个 任务 执行 过 程 中 要 使 用 的 
CAD 工具 , 称 为 设计 方法 学 。 在 下 一 部 分 中 ， 我 们 将 入 要 语 论 过 去 和 现在 在 工业 证 须 中 曾 占 
支配 地 位 的 设计 方法 学 。 


1.3 当前 的 设计 方法 学 


在 过 去 的 25 年 中 ,大 多 数 ASIC 和 系统 生产 厂家 采用 一 种 基于 “捕获 - 模拟 "(capture- 
and-simulate) 的 设计 方法 学 。 这 种 设计 方法 学 开始 于 对 产品 的 一 组 特定 需求 ,该 需求 通常 由 
市 场 部 门 提供 。 由 于 这 些 需 求 不 能 赛 括 有 关 产 品 实现 的 任何 信息 , 故 由 首席 设计 师 组 成 的 小 
组 提出 一 个 芯片 体系 结构 的 粗略 结构 图 ,作为 虽 不 完备 但 初步 的 系统 描述 。 在 某 些 情况 下 ,这 
个 初步 结构 图 在 提交 给 逻辑 和 版 图 设计 者 小 组 之 前 还 要 被 进一步 细 化 ,而 逻辑 和 版 图 设计 者 
的 任务 是 将 每 个 功能 模块 转换 为 逻辑 或 电路 原理 图 (最 终 被 原理 图 捕获 工具 所 捕获 ) ,通过 模 
拟 方法 对 功能 时 延 及 故障 覆盖 率 进行 验证 。 这 个 被 捕获 的 原理 图 ,在 门 阵列 技术 中 可 用 于 驱 
动物 理 设 计 工具 进行 门 的 布局 和 布线 ,或 在 定制 技术 中 用 于 在 布局 和 布线 前 将 门 映射 到 标准 
和 定制 单元 。 

仅仅 在 最 近 儿 年 ,逻辑 综合 才 被 公 \ 认 为 是 设计 过 程 构 成 整体 所 必需 的 部 分 ， 而 这 种 认可 时 
致 了 在 设计 方法 学 上 的 革命 性 变化 ,因为 “捕获 -模拟 "方法 正 逐 步 让 位 于 “描述 — 综合 (de- 
scribe-and-synthesize) 方 法 学 。 AMIRI EHO E T 省 我 们 用 纯 行为 形式 丘 述 个 
计 , 而 不 包括 实现 细节 。 特 别 地 ,我 们 能 采用 布尔 方程 和 有 限 状 态 机 图 描述 设计 。 在 这 个 方法 
学 中 ,设计 结构 采用 CAD 工具 目 动 综合 生成 ， 而 不 是 用 手工 综合 而 成 ， 因为 除非 对 于 简单 电 
路 ,手工 综合 是 一 项 非常 乏味 的 工作 。 

“描述 - 综合 "方法 学 可 应 用 于 若干 抽象 层次 。 在 门 级 ， 功能 和 控制 单元 可 采用 远 辑 综 
(logic synthesis) 方 法 进行 综合 。 例 如 ,功能 单元 如 ALU、 比 较 器 及 多 路 选择 器 等 ， 可 用 布尔 
程 描 述 ,然后 通过 两 个 阶段 进行 综合 。 第 一 个 阶段 , 称 为 逻辑 最 小 化 (logic minimization) ,使 布 
尔 方程 中 “与 "和 “或 ”运算 符 的 数量 (或 者 在 相等 意义 上 ,文字 的 数量 ) 达 到 最 小 化 ,同时 满足 代 
价 和 时 间 约 束 。 第 2 个 阶段 , 称 为 工艺 映射 (technology mapping), 将 这 些 已 最 小 化 的 布尔 方 
程 采用 人 逻辑 门 实现 , 这 些 逻 辑 门 来 自 于 选 定 工艺 技术 的 门 库 。 

另 一 方面 ,控制 单元 采用 有 限 状 态 机 图 定义 ,然后 通过 两 个 阶段 综合 。 第 1 个 阶段 , 称 为 
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状态 最 小 化 (state minimization) ,使 状态 数 达 到 最 小 化 ,并 为 每 个 状态 分 配 2 进 制 编码 ,使 得 实 


现 次 态 和 输出 函数 所 需 代 价 降 低 。 在 第 2 个 阶段 ,由 布尔 方程 定义 的 次 态 和 输出 函数 通过 逻 
辑 最 小 化 和 技术 映射 进行 优化 ,方法 如 前 所 述 。 

在 寄存 器 级 ,表示 处 理 器 、 内 存 及 ASIC 的 微 芯 片 ,可 采用 行为 综合 (behavioral synthesis) 
或 高 层次 综合 (high level synthesis) 技 术 进 行 综 合 。 这 些微 芯片 的 结构 包含 功能 、 存 储 及 控制 
单元 ,这 些 单元 预先 已 设计 好 并 存储 于 寄存 器 级 库 中 。 这 些微 芯片 的 行为 可 通过 程序 、 算 法 、 
流程 图 .数据 流 图 .指令 集 的 方式 描述 ,或 通过 广义 有 限 状 态 机 描述 ,在 其 中 的 每 个 状态 可 执行 
任意 复杂 的 计算 。 | 

我 们 通过 完成 3 个 主要 的 综合 任务 将 行为 描述 转换 成 结构 描述 :分配 BE SBE BE 
(allocation) 的 任务 是 确定 用 于 实现 微 芯片 所 需 的 寄存 器 级 组 件 或 资源 的 数量 。 换 句 话 说 , 确 
定 功 能 单元 的 数量 ,每 个 功能 单元 执行 的 操作 ,流水 线 级 数 ,每 个 操作 的 时 延 ,以 及 每 个 单元 的 
代价 和 大 小 。 分 配 还 必须 确定 存储 单元 的 数量 ,如 所 需 的 寄存 器 寄存 器 文件 .队列 及 内 存 。 
除了 每 个 单元 的 大 小 、 代 价 以 及 所 需 端口 数 之 外 ,还 必须 确定 每 个 存储 单元 的 读 出 和 与 人 所 需 
访问 时 间 。 最 后 ,分配 还 必须 确定 系统 中 每 种 总 线 的 数量 ,大 小 .协议 及 时 延 ,以 及 为 连接 功能 
单元 和 存储 单元 到 这 些 总 线 所 需 的 各 种 操作 。 在 很 多 种 情况 下 ,分配 提供 了 一 个 在 代价 一 性 
能 折 中 方面 进行 探索 的 机 会 ,这 是 非常 重要 的 ,因为 进行 更 大 量 的 对 诸如 功能 存储、 互联 单元 
等 资源 的 分 配 ,可 提高 性 能 ,但 一 般 也 增加 了 代价 。 

一 日 资源 被 分 配 ,调度 (scheduling) 的 任务 就 是 将 行为 描述 划分 成 时 间 间 隔 , 称 为 控制 步 。 
在 每 个 控制 步 期 间 ,通常 是 一 个 时 钟 周期 长 度 ,数据 从 一 个 寄存 器 传输 到 另 一 个 寄存 器 , 且 知 
有 必要 ,还 在 传输 过 程 中 由 功能 单元 进行 变换 。 在 每 个 控制 步 ,所 有 的 寄存 器 传输 都 是 并 发 执 
行 的 。 这 样 ,设计 的 性 能 大 致 与 在 每 个 控制 步 中 可 得 到 的 资源 数量 成 比例 。 

必须 注意 ,虽然 调度 任务 可 确定 在 每 个 控制 步 中 的 所 有 操作 ,但 却 不 将 操作 分 配 到 特定 的 
寄存 器 级 组 件 中 。 这 项 工作 由 绑 定 (binding) 任 务 来 完成 , 绑 定 的 任务 是 将 变量 分 配 到 存储 单 
元 ,操作 分 配 到 功能 单元 ,并 且 对 于 每 个 从 存储 单元 到 功能 单元 及 反方 四 的 数据 传输 ,确保 能 
分 配 一 条 特定 的 通信 和 路径 或 总 线 。 

通过 采用 逻辑 和 行为 综合 ,描述 -综合 "方法 学 能 使 设计 者 用 不 含 任何 时 延 、 工 程 或 工 志 
信息 的 行为 描述 方法 来 描述 微 芯片 的 功能 ,然后 自动 综合 成 包含 寄存 器 组 件 的 结构 描述 ,并 随 
后 综合 成 门 级 元 件 。 

逻辑 和 行为 综合 的 意义 是 ,在 过 去 的 十 年 中 ,它们 已 成 功 地 将 “捕获 -模拟 "方法 学 转换 为 
“描述 二 综合" 方 法学。 逻辑 综合 较 早 为 设计 界 所 接受 ,因为 设计 者 发 现 , 逻 辑 综合 容易 吸收 进 
“捕获 一 模 拟 ”方法 学 ,其 原因 是 这 种 方法 学 已 经 关注 于 捕获 和 模拟 门 级 原理 图 或 网 表 , 故 已 有 
必需 的 图 形 捕 获 工具 、 模 拟 器 、 库 和 框架 。 换 句 话 说 ， 显然 逻辑 综合 能 通过 优化 其 捕获 的 原理 
图 .给 “捕获 -模拟 ”方法 学 附加 额外 的 价值 。 一 旦 逻辑 综合 被 接受 ,设计 者 就 开始 采用 布尔 表 
达 式 来 描述 逻辑 ,取代 用 图 形 捕获 工具 来 捕获 门 的 方法 。 最 终 ,这 种 新 技术 鼓励 了 通过 行为 摘 
述 而 不 是 原理 图 来 捕获 设计 的 实践 ,尤其 是 采用 行为 描述 后 ,导致 了 生产 率 的 大 幅度 提高 。 

行为 综合 比 逻 辑 综 合 花 费 较 长 时 间 被 接受 的 主要 原因 是 缺乏 对 行为 综合 提供 支持 的 基 
础 。 换 句 话 说 ,没有 在 寄存 器 级 的 图 形 捕获 工具 ， 设计 者 完全 不 习惯 通过 硬件 描述 语言 如 
VHDL 来 捕获 设计 。 最 基本 的 问题 是 ,设计 者 受到 的 是 以 结构 而 不 是 以 行为 来 进行 思维 的 训 
A ,而 新 方法 要 求 他 们 应 对 若干 新 的 问题 。 比 如 ,第 1 个 问题 是 ,每 个 设计 可 用 若干 种 方式 描 
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述 ,采用 不 同 的 硬件 描述 语言 结构 。 由 于 描述 的 风格 对 综合 后 设计 的 质量 有 重大 的 影响 ,行为 


综合 就 要 求 对 综合 算法 和 CAD 工具 的 工作 有 深入 理解 。 第 2 个 问题 ,抽象 的 寄存 器 级 不 带 有 
可 模拟 模型 的 组 件 库 ,因此 每 个 设计 小 组 不 得 不 开发 自己 的 模型 。 最 后 ,直至 最 近 才 出 现 探 索 
工具 环境 ,这 种 工具 可 供 设计 者 做 关键 性 的 决策 ,甚至 在 使 用 行为 综合 工具 对 剩余 部 分 进行 设 
计 之 前 ,部 分 地 描述 设计 。 正 是 在 处 理 这 些 问 题 的 过 程 中 ,设计 者 逐渐 发 现 :关注 于 对 行为 的 
正确 描述 ,然后 使 用 自动 工具 对 大 量 的 可 能 解 进行 探索 和 比较 ,会 产生 巨大 的 生产 效益 。 
现在 ,在 成 功 引 入 逻辑 和 行为 综合 工具 后 ,系统 设计 者 和 CAD 业界 一 致 的 疑问 是 : 
“描述 -综合 "方法 学 能 否 扩展 ,应 用 于 整个 系统 ,包括 软件 和 硬件 设计 。 换 名 话说 ,如 采 继 续 
向 这 个 趋势 发 展 到 芯片 级 以 上 ,关注 于 更 高 的 抽象 级 别 , 则 生产 率 可 能 会 得 到 更 大 的 提高 。 在 
下 一 部 分 ,我 们 将 对 这 种 系统 级 方法 学 的 需求 和 实质 问题 加 以 讨论 。 


1.4 系统 级 方法 学 


一 般 而 言 , 在 较 高 抽象 级 别 上 的 设计 方法 学 尚未 很 好 地 确立 。 如 前 所 述 ,市 场 部 门 通常 定 
义 市 场 需 求 ,而 首席 设计 师 给 出 非 正式 的 框图 ,在 进行 某 些 初始 设计 后 ,从 中 可 得 出 设计 描述 。 
产生 框图 的 那些 设计 决策 ,通常 是 基于 特定 设计 师 的 个 人 经 验 ,而 不 是 基于 对 所 有 可 能 的 结构 
和 工艺 选择 的 探索 。 此 外 ,这 些 框图 通常 是 在 缺乏 对 系统 功能 性 全 面 了 解 的 情况 下 产生 的 。 
这 种 对 系统 功能 性 定义 的 滞后 经 常 导 致 更 长 的 设计 周期 ,因为 在 设计 后 期 发 现 的 矛盾 需要 很 
耗 时 的 设计 反复 。 

与 这 种 以 特定 的 方式 获得 功能 性 相反 ,更 可 取 的 方法 是 ,在 设计 的 最 早期 阶段 ,在 尚未 做 
出 任何 设计 决策 之 前 ,将 更 多 的 努力 投入 到 对 系统 功能 的 描述 上 ,因为 这 种 早期 的 努力 会 获得 
巨大 而 全 面 的 回报 。 特 别 地 ,与 设计 描述 ,尤其 是 与 可 执行 的 设计 描述 打交道 有 很 大 的 优点 ， 
因为 这 不 仅 能 捕获 系统 的 功能 性 ,而 且 还 能 被 市 场 部 门 利用 来 研究 产品 在 市 场 上 的 竞争 能 力 。 
另外 ,可 执行 的 系统 描述 在 设计 过 程 的 所 有 步骤 中 均 可 作为 文档 ,尤其 是 在 促进 并 发 工程 方 
面 , 能 够 对 分 派 给 设计 小 组 中 不 同 成 员 的 不 同 子 系统 清晰 地 定义 功能 性 和 接口 。 而 且 , 这 些 子 
系统 中 的 任何 一 个 发 生变 化 都 易于 处 理 , 其 对 系统 其 他 部 分 的 影响 可 快速 估计 。 可 执行 的 系 
统 描述 还 适合 于 对 系统 的 不 同 设计 性 质 及 功能 性 进行 自动 验证 。 此 外 ,可 执行 的 系统 描述 的 
优势 还 在 于 不 仅 允许 功能 验证 的 自动 化 ,而 且 一 旦 做 出 了 适当 的 工艺 决策 ,还 允许 设计 探索 和 
设计 综合 的 自动 化 。 最 后 ,可 执行 的 系统 描述 还 能 持续 作为 所 有 产品 在 其 生命 期 中 进行 升级 
的 起 点 ,并 支持 产品 维护 。 

一 昌 我 们 采用 了 可 执行 的 系统 描述 , 则 选择 用 来 编写 这 些 描述 的 语言 就 成 为 系统 设计 方 
法 学 中 最 主要 的 问题 之 一 。 为 了 和 CAD 工具 接口 ,这 样 的 语言 必须 易于 捕获 、 理 解 和 使 用 。 
这 种 语言 必须 能 够 捕获 系统 的 所 有 特征 ,并 易于 对 实现 进行 综合 。 最 后 ,这 样 的 语言 应 能 以 易 
读 的 和 完备 的 而 又 不 是 过 度 复杂 的 方式 对 系统 及 其 实现 进行 建 模 。 

语言 选择 并 不 是 在 定义 系统 设计 方法 学 中 遇 到 的 唯一 问题 。 一 旦 系统 被 描述 后 ,确保 所 
选择 的 系统 方法 学 能 允许 在 设计 选择 间 容 易 地 进行 探索 ,也 是 必要 的 。 在 这 样 的 方法 学 中 , 首 
先 必须 允许 设计 者 分 派 结构 组 件 和 约束 。 结 构 组 件 就 是 处 理 器 、 存 储 器 及 ASIC。 处 理 器 由 其 


指令 集 和 每 个 指令 的 执行 速度 来 定义 ;存储 器 由 其 大 小 、 读 / 写 协 议 及 存 取 时 间 来 定义 ;ASIC 


由 其 门 数 ( 门 阵列 ) 或 晶体 管 数 (定制 设计 ) 表 示 的 大 小 . 门 或 晶体 管 的 传播 时 延 、 封 装 大 才 及 所 
允许 的 功 耗 等 来 定义 。 
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接 下 来 ,设计 描述 必须 被 划分 成 软件 部 分 和 硬件 部 分 。 软 件 部 分 将 用 软件 实现 并 在 一 个 
或 多 个 指定 的 处 理 器 上 执行 ,而 硬件 部 分 将 综合 成 一 个 或 多 个 ASIC。 系 统 的 软件 部 分 可 进 一 
步 划 分 成 两 个 或 多 个 部 分 ,每 个 部 分 在 独立 的 处 理 器 上 运行 。 不 难 想像 一 个 主 处 理 器 运行 较 
慢 的 系统 功能 同时 又 有 一 个 或 多 个 协 处 理 器 执行 快速 数据 转换 的 情况 。 类 似 地 ,硬件 部 分 可 
能 也 不 适合 用 单一 的 ASIC 实现 , 即 可 能 需要 用 若干 个 ASIC 实现 。 

由 于 对 每 个 不 同 的 处 理 器 组 件 的 指派 和 不 同 的 划分 将 会 产生 不 同 的 系统 实现 , 若 对 各 种 
选择 进行 评估 ,就 需要 设计 者 对 每 种 实现 的 诸如 性 能 .成 本 DRE .测试 和 封装 成 本 等 质量 度量 
进行 估计 。 将 估计 出 的 每 组 质量 度量 与 给 定 的 要 求 进行 比较 ,并 选择 其 中 对 需求 满足 最 好 的 
实现 。 这 样 , 这 种 得 自 于 设计 描述 的 设计 探索 将 能 使 设计 者 寻找 到 最 有 成 本 效益 的 解决 方案 。 

一 旦 寻找 到 最 佳 解决 方案 ,就 需要 对 设计 描述 进行 细 化 以 反映 指派 和 划分 方面 的 决策 ,使 
得 设计 描述 的 不 同 部 分 被 移 到 适合 的 组 件 中 ,并 在 独立 的 部 分 中 保持 通信 联系 。 

细 化 完成 后 ,设计 描述 将 反映 出 产品 的 体系 结构 , 正 像 首席 设计 师 设 计 的 框图 所 反映 的 一 
样 。 系 统 组 件 及 其 相互 通信 和 都 得 到 明确 定义 ,每 个 组 件 有 其 自己 的 描述 ,并 可 在 计算 被 分 配 到 
处 理 器 时 ,由 标准 的 编译 器 进行 编译 ;或 者 在 计算 被 分 配 到 定制 的 ASIC 时 ,由 行为 和 人 逻辑 综 
合 工具 进行 综合 。 当 然 ,在 细 化 的 系统 描述 和 设计 师 的 框图 之 间 会 存在 差别 :首先 , 细 化 的 系 
统 描述 是 在 对 大 量 解 决 方案 进行 彻底 和 有 组 织 的 探索 后 获得 的 ;其 次 , 细 化 的 系统 描述 是 从 原 
始 系统 描述 中 形式 化 地 得 出 的 ,因而 更 具 一 致 性 ,消除 了 高 代价 的 . 耗 时 的 设计 反复 。 


1.5 系统 描述 和 设计 


在 前 面部 分 中 ,我们 已 简要 地 描述 了 基于 “描述 - 探索 - 细 化 "模式 的 系统 级 设计 方法 学 。 
这 种 方法 学 的 优势 预示 着 生产 率 的 大 幅度 提高 ,因为 精确 的 系统 描述 .自动 探索 及 细 化 等 技术 
能 帮助 我 们 避免 由 多 次 设计 反复 而 造成 设计 周期 的 大 幅度 增加 。 这 种 方法 学 只 需要 设计 者 选 
择 工 艺 .分派 组 件 和 描述 需求 ,然后 在 一 天 内 完成 对 数 百 个 可 选择 设计 的 自动 探索 。 最 后 , 当 
做 出 结构 和 工艺 决策 时 ,加 入 更 多 结构 上 的 细节 以 细 化 系统 描述 。 重 复 进行 该 过 程 直 至 达到 
一 个 完整 的 结构 描述 ,包含 组 件 库 所 定义 的 适当 抽象 级 别 的 组 件 。 

我 们 相信 ,为 了 适应 不 断 增加 的 系统 复杂 性 和 不 断 缩短 的 上 市 需求 ,必须 确立 一 种 清晰 和 
有 效 的 系统 设计 方法 学 ,并 将 其 引入 到 设计 过 程 中 。 为 此 ,本 书 综述 各 种 有 关 嵌 入 式 系统 的 系 
统 描述 ,探索 及 细 化 的 技术 。 我 们 首先 简要 综述 用 于 软件 和 硬件 系统 的 捕获 、 分 析 及 实现 的 不 
同 模型 (第 2 章 )。 接 着 我 们 阐述 租 和 人 式 系统 的 基本 特点 ,还 对 若干 种 系统 描述 语言 进行 了 综 
述 ,并 在 对 这 些 基 本 特点 支持 优 劣 的 基点 上 ,对 这 些 系 统 描述 语言 进行 了 比较 (第 3 章 )。 为 了 
示范 系统 描述 的 技巧 ,我 们 针对 一 个 小 型 的 租 和 人 式 系统 一 一 电话 应 答 机 ,设计 了 一 个 完整 的 可 
执行 系统 描述 。 我 们 还 示范 了 对 系统 描述 语言 的 适当 选择 ,如 何 能 够 简化 编写 、 理 解 及 细 化 系 
统 描述 (第 4 章 )。 为 了 证 实 可 执行 系统 描述 的 正确 性 ,我们 需要 对 其 进行 验证 ,或 者 以 预先 定 
义 的 测试 向 量 对 其 进行 模拟 。 对 于 后 一 种 情况 ,该 系统 描述 需要 转换 成 某 种 模拟 器 能 接受 的 
标准 模拟 语言 。 为 此 ,第 5 章 综述 了 各 种 转换 技术 ,并 以 IEEE 标准 的 VHDL 语言 为 例 ,对 这 
些 技 术 进行 了 示范 。 

有 关系 统 探索 的 过 程 的 内 容 涵盖 于 对 系统 描述 进行 划分 和 设计 质量 度量 进行 评估 的 讨论 
中 。 在 这 些 领 域 中 ,我 们 综述 了 有 关 对 系统 描述 进行 划分 的 各 种 算法 和 技术 (第 6 章 ), 以 及 用 
于 对 质量 度量 如 软件 性 能 .数据 和 程序 所 占 存储 器 大 小 、 硬 件 性 能 \ 时 钟 周期 微 芯 片面 积 以 及 
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封装 代价 等 进行 评估 的 技术 (第 7 章 )。 在 对 系统 彻底 地 进行 了 探索 之 后 ,需要 对 系统 描述 进 
行 细 化 以 反映 在 探索 阶段 所 做 出 的 决策 。 为 此 目的 ,综述 了 用 于 对 系统 描述 进行 细 化 的 各 种 
算法 和 技术 (第 8 章 )。 在 最 后 一 章 (第 9 章 ) ,将 前 八 章 的 内 容 进行 综合 ,形成 一 个 整体 一 致 的 
系统 级 设计 方法 学 ,并 说 明了 其 在 整个 设计 过 程 中 所 扮演 的 角色 。 

我 们 相信 ,本 书 的 内 容 将 揭示 出 系统 设计 的 艺术 ,帮助 读者 为 他 们 的 应 用 和 环境 选择 最 好 
的 系统 设计 方法 学 。 





第 2 章 ， 模型 与 体系 结构 


设计 一 个 系统 的 第 一 步 应 详细 指定 其 功能 性 ， 而 系统 描述 的 第 一 步 应 该 准确 勾勒 出 其 功 
能 性 的 具体 含义 。 可 以 利用 多 种 概念 模型 来 帮助 我 们 以 一 种 系统 化 的 方式 理解 和 组 织 系 统 功 
能 。 本 章 纵 观 几 种 在 硬件 和 软件 系统 中 最 为 常用 的 概念 模型 ,以 及 实现 这 些 系 统 所 使 用 的 多 
种 体系 结构 。 


2.1 引言 


系统 设计 是 指 用 一 组 物理 组 件 实现 所 期 望 的 功能 性 的 过 程 。 很 明显 ,系统 设计 的 整个 过 
程 必须 从 详细 指定 系统 期 望 功 能 性 开始 。 但 是 ,这 并 不 是 一 件 容 易 的 工作 。 作 为 一 个 例子 ,我 
们 来 考虑 描述 一 个 电 樟 控制 项 的 任务 。 如 何 仿 可 能 详细 地 搞 述 这 年 的 切 能 ;在 任 管 按键 由 厅 
之 后 完全 准确 地 估计 出 电梯 的 位 置 ? 用 自然 语言 进行 系统 描述 的 问题 在 于 它们 是 有 此 义 且 不 
完全 的 ,缺乏 提供 给 这 样 一 个 系统 所 需要 的 细节 的 能 力 。 因 此 ,我 们 需要 一 一 种 更 为 精确 的 方法 
来 详细 指定 功能 性 。 

为 达到 我 们 所 要 求 的 准确 度 级 别 ， 最 为 普遍 的 方法 是 把 系统 想像 成 由 较为 简单 的 子 系统 
或 者 小 模块 所 组 成 的 集合 。 下 一 节 将 要 介绍 ,至少 有 5 种 方法 可 以 把 系统 功能 分 解 成 较为 简 
单 的 小 模块 。 基 本 上 ,区 分 这 些 方法 就 要 看 分 成 的 小 模块 的 类 型 以 及 把 这 些小 模块 组 合 起 来 
构建 系统 功能 性 时 所 遵从 的 规则 。 我 们 把 每 一 种 特别 的 方法 称 为 一 个 模型 (model) 。 

为 了 保证 可 用 性 ,模型 必须 具备 某 些 特性 。 首 先 ,模型 应 该 是 形式 化 的 ,使 其 不 存在 歧义 。 
同时 它 也 应 该 是 完整 的 ,这 样 才 能 描述 整个 系统 。 此 外 ,对 于 设计 者 来 说 他 所 用 的 模型 应 该 是 
易于 理解 的 ,也 应 该 是 易于 修改 的 ,因为 设计 者 在 某 些 点 上 需要 对 系统 的 功能 性 修改 是 不 可 吉 
免 的 。 最 后 ,模型 应 该 足够 自然 的 ,而 对 设计 者 对 系统 的 理解 起 到 帮助 作用 而 不 是 阻碍 作用 。 

需要 注意 的 是 ,一 个 模型 是 由 对 象 和 组 合 规则 所 组 成 的 形式 化 系统 ,用 于 对 系统 特性 的 摘 
述 。 通 常情 况 下 ,我们 使 用 一 个 特定 的 模型 把 系统 分 解 成 小 模块 ,然后 再 通过 使 用 特定 的 语言 
对 这 些小 模块 进行 描述 ,从 而 生成 系统 描述 。 一 种 语言 可 以 描述 多 种 不 同 的 模型 ,而 一 种 模型 
也 可 用 多 种 不 同 的 语言 持 述 。 

使 用 模型 的 目的 是 要 给 出 系统 的 抽象 视图 。 比 如 说 ,图 2-1 中 给 出 了 电梯 控制 器 的 两 种 
不 同 模型 ,图 2-1a 是 它们 的 自然 语言 描述 。 这 两 种 模型 之 间 的 区 别 在 于 :图 2-1b 使 用 一 组 程 
序 语句 来 表示 控制 器 ,而 图 2-1c 使 用 状态 机 来 表示 控制 项 。 

正如 我 们 所 看 到 的 ,每 一 个 模型 都 表示 一 组 对 象 以 及 这 些 对 象 之 间 的 相互 关系 。 举 例 来 
说 ,状态 机 模型 是 由 一 组 状态 以 及 这 些 状态 之 间 的 迁移 所 构成 的 ;相对 地 ,算法 模型 是 由 分 文 
和 循环 的 控制 顺序 下 所 执行 的 一 组 语句 所 构成 的 。 允 许 这 些 不 同 的 模型 在 设计 中 出 现 的 好 处 
就 在 于 它们 可 以 使 设计 者 表示 系统 的 不 同 视图 ,从 而 表示 出 系统 的 不 同 特性 。 例 如 ,状态 机 模 
型 非常 适合 表现 一 个 系统 的 时 态 行为 ,因为 它 允 许 设 计 者 显 式 地 表示 状态 和 由 于 外 部 或 内 部 
事件 导致 的 状态 转移 。 而 另 一 方面 ,算法 模型 则 没有 外 在 的 状态 表示 。 但 是 ,因为 它 可 以 利用 
一 连 串 的 语句 详细 指明 系统 的 输入 一 输出 关系 ,所 以 它 非常 适合 于 表示 系统 的 过 程 视 图 。 

设计 者 在 设计 过 程 的 不 同 阶段 会 选取 不 同 的 模型 ,为 的 是 在 特定 的 时 间 内 强调 那些 令 他 
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如 果 电 梯 是 静止 的 ， 并 且 要 达到 的 楼 层 和 
当前 所在 楼 层 一 致 ， 则 电梯 保持 空闲 。 


如 果 电 梯 是 静止 的 ， 并 且 要 达到 的 楼 层 低 于 


if (req_fioor = curr_floor) then 
Steen := idle; 

els floor < curr_fioor) then 
direction = ; 


当前 所 在 楼 层 ， 则 电梯 向 要 达到 的 楼 层 下 降 。 elsif (req_floor > curr_floor) then 
direction := up; 





如 果 电 梯 是 静止 的 ， 并 且 要 达到 的 楼 层 高 于 end if; 
当前 所 在 楼 层 ， 则 电梯 向 要 达到 的 楼 层 上 升 。 end loop; 
a) 功能 的 自然 语言 描述 b) 算法 模型 
floor < Curr_floor floor = curr_fioor floor > curr_fioo 
(ep oor -= ano (ep goorn := idle ( direction := up ý 





floor floor > curr_floor 
( i directio := 0 ( i direction := Up ) 
ed 


req_floor = curr_fioor floor = curr_floor 
(req foor= e = idle ) (reg foore = idie ) 


(req_fioor < curr_foor) / direction := up 


c) 状态 机 模型 
图 2-1 电梯 控制 器 的 概念 视图 


们 感 兴趣 的 方面 。 例 如 ,在 系统 描述 阶段 ,设计 者 除了 系统 的 功能 性 之 外 对 别 的 一 无 所 知 ,所 
以 他 很 倾向 于 使 用 一 种 不 反应 任何 实现 信息 的 模型 。 但 是 在 系统 的 实现 阶段 , 当 有 关系 统 组 
件 的 信息 都 是 已 知 的 情况 下 ,设计 者 将 会 选取 能 够 表示 系统 结构 的 模型 。 

不 同 的 应 用 范围 同样 需要 不 同 的 模型 。 比 如 说 ,设计 者 会 对 实时 系统 和 数据 库 系统 使 用 
不 同 的 模型 ,因为 前 者 强调 的 是 时 态 行为 ,而 后 者 着 重 于 数据 组 织 。 

一 旦 设计 者 找到 了 可 以 详细 指定 系统 功能 性 的 合适 模型 ,他 就 可 以 详细 准确 地 描述 出 系 
统 如 何 工作 。 但 是 到 了 这 一 步 , 设 计 过 程 还 没有 完成 ， 
因为 这 样 的 一 个 模型 并 没有 准确 地 描述 出 系统 将 会 如 
何 制造 。 因 此 ,下 一 步 就 是 要 将 模型 转化 成 体系 结构 
(architecture) ,通过 指定 组 件 的 数量 和 类 型 以 及 组 件 
之 间 的 关联 ,来 定义 模型 的 实现 方法 。 例 如 ,图 2-2 H 
出 两 种 不 同 的 体系 结构 ,其 中 的 任何 一 种 都 可 以 用 来 
实现 图 2-1c 中 电梯 控制 器 的 状态 机 模型 。 图 2-2a 中 
的 体系 结构 是 寄存 器 级 的 实现 , 它 用 一 个 状态 寄存 器 
来 存放 当前 状态 ,用 组 合 逻 辑 来 实现 状态 转移 和 和 输出 
言 号 的 赋值 。 在 图 2-2b 中 是 系统 级 实现 , 它 将 该 状态 
机 模型 映射 成 软件 ,使 用 程序 中 的 一 个 变量 来 表示 当 
前 状态 ,使 用 程序 中 的 语句 来 计算 状态 转移 和 输出 信 
号 的 值 。 在 这 个 体系 结构 中 ,程序 存放 在 内 存 中 ,由 处 b) 系统 级 实现 
BRAIT N 图 2.2 所 使 用 的 体系 结构 

模型 和 体系 结构 是 抽象 的 最 高 层次 的 概念 视图 和 
实现 视图 。 用 模型 来 描述 一 个 系统 是 如 何 工作 的 ,而 
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体系 党 吉 构 用 来 表示 系统 是 如 何 实现 的 。 设 计 过 程 就 是 将 模型 转化 成 体系 结构 的 设计 任务 的 集 
合 。 在 设计 过 程 的 最 初 阶段 ,知道 的 仅仅 是 系统 的 功能 性 。 而 后 ,设计 者 的 工作 就 是 要 用 茶 种 
基于 最 合适 的 模型 的 某 种 语言 将 功能 性 描述 出 来 。 随 着 设计 过 程 的 继续 ,过 程 中 的 每 一 步 都 
加 入 了 更 多 的 细节 ,从 而 得 到 体系 结构 。 通 常 , 设 计 者 们 将 会 发 现 某 些 体系 结构 在 实现 茶 些 模 
型 时 会 更 加 有 有效。 另外 ,设计 和 实现 技术 也 会 对 体系 结构 的 选取 产生 很 大 的 影响 。 因 此 ,在 设 
计 过 程 完 成 之 前 ,设计 者 不 得 不 考虑 多 种 不 同 的 实现 手段 与 方法 。 
本 章 第 一 部 分 比较 当前 用 于 硬件 和 软件 的 设计 方法 学 中 的 不 同 的 模型 ,并 展示 每 个 模型 
中 如 何 表 示 系 统 中 的 数据 状态、 动作 和 人 /或 结构 。 本 草 第 二 部 分 纵 观 在 这 些 模型 的 实现 中 可 
能 会 用 到 那些 不 同 的 体系 结构 。 


2.2 模型 分 类 


系统 设计 者 们 在 他 们 各 种 不 同 的 硬件 或 软件 的 设计 方法 学 中 使 用 多 种 不 同 的 模型 。 总 体 
来 说 ,这 些 模型 可 以 分 成 5 种 不 同 的 类 别 :(1) 面 向 状态 (2) 面 向 活动 (3) 面 向 结构 (4) 面 向 
数据 和 (5) 异 构 。 面 向 状态 的 模型 (state-oriented model) ,比如 说 有 限 状态 机 ,是 用 一 组 状态 以 
及 由 外 部 事件 触发 的 状态 间 的 迁移 来 表示 系统 的 。 面 向 状态 的 模型 最 适用 于 控制 系统 ,比如 
说 实时 反应 系统 ,因为 在 这 样 的 系统 中 系统 的 时 态 行 为 是 设计 的 最 重要 的 方面 。 面 向 活动 的 
7% A (activity-oriented model), 比如 说 数据 流 图 , 它 把 系统 描绘 成 一 组 与 数据 或 者 执行 的 相关 
性 有 关 的 活动 的 集合 。 这 个 模型 最 适合 应 用 到 变换 系统 中 去 ,比如 说 数字 信号 处 理 系 统 , 在 这 
个 系统 中 数据 以 国定 的 速率 传输 并 经 过 一 系列 的 变换 。 而 使 用 面向 结构 的 模型 (structure-ori- 
ented model) , 比如 说 框图 ,可 以 描述 系统 的 物理 模块 以 及 它们 之 则 的 互联 关系 。 与 面向 状态 
和 面向 活动 的 模型 主要 反应 系统 的 功能 性 不 同 的 是 ,面向 结构 的 模型 着 重 强调 了 系统 的 物理 
构成 。 此 外 , 当 我 们 想 把 系统 表示 成 为 一 组 由 属性 、 类 成 员 等 表征 的 数据 集合 时 ,还 可 以 使 用 
面向 数据 的 模型 (data-oriented model) ,比如 说 实体 一 关系 图 。 这 个 模型 最 适用 于 信息 系统 , 比 
如 说 数据 库 系统 ,因为 在 数据 库 中 系统 的 功能 不 及 系统 的 数据 组 织 重 要 。 最 后 ,设计 者 也 可 以 
使 用 异 构 模 型 (heterogeneous model) 
以 利用 它 来 表达 出 一 个 复杂 系统 的 多 种 不 同 的 视图 。 

同样 值得 注意 的 是 一 些 方法 学 中 同时 使 用 了 多 种 不 同 的 模型 ， 以 此 来 表达 系统 中 不 同 的 
正 交 视 图 。 例 如 ,Statemate 工具 [HLN 88] 就 混合 了 3 种 不 同 的 模型 :(1) 功 能 分 解 和 信息 流 
的 活动 图 ;(2) 时 态 行 为 和 控制 关系 的 状态 图 ;(3) 物 理 结构 分 解 和 信息 流 的 方 框图 。 应 该 注意 





这 种 含有 不 同 视图 的 复合 设计 模型 并 不 是 一 个 异 构 模 型 ,因为 这 3 个 不 同 的 模型 所 表现 的 信 


自 并 不 能 够 通过 一 个 共有 的 数据 结构 而 彼此 互相 联系 。 相 反 地 ,对 于 蜡 构 模 型 ,我 们 看 到 是 单 
一 的 .紧密 集成 的 模型 ,在 这 个 模型 中 不 同 的 设计 视图 均 来 自 同一 个 信息 模型 。 比 如 说 ,可 以 


考虑 控制 /数据 流 图 。 因 为 它 在 一 种 表现 形式 的 基础 上 给 出 了 两 种 不 同 的 视图 ,可 以 认为 它 是 ， 


一 个 异 构 模型 。 
2.3 面向 状态 的 模型 


2.3.1 有 限 状态 机 | 
有 限 状 态 机 (finite-state machine ，FSM) 是 面向 状态 模型 的 一 个 例子 。 它 在 描述 控制 系 


综合 了 前 4 种 模型 的 特征 的 一 种 模型 一 一 设计 者 可 . 
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统 方面 是 最 为 流行 的 模型 ， 因为 控制 系统 的 时 态 行为 被 表示 成 状态 及 状态 之 间 的 迁移 是 最 为 
日 然 的 。 

一 般 来 说 ,FSM 模型 是 由 状态 (state) 集 合 .状态 之 间 的 迁移 (transition) 集 合 和 与 这 些 状 

态 或 者 迁移 相关 的 活动 (action) 集 合 所 组 成 的 。 更 形式 化 表示 ,FSM 是 由 五 部 分 组 成 : 
<S,I,O,f:SxI~S,h:SxXI~O> (2-1) 

其 中 ,S 一 1s 35 是 状态 集合 ,7 一 {i1,12,"…,im| 是 输入 集合 ,O 一 {ol ,op ，…， 
0; | 是 输出 集合 ;了 是 下 一 状态 函数 ,根据 当前 状态 和 输入 来 决定 下 一 状态 ;而 h 是 输出 函数 ， 
同样 根据 当前 状态 和 输入 来 得 到 输出 。 值 得 注意 的 是 ,任何 一 个 FSM 模型 都 有 一 个 状态 作为 
起 始 状 态 , 有 一 组 状态 作为 终止 状态 。 

在 图 2-3 中 ,我 们 可 以 看 到 一 个 三 层 建筑 的 电梯 控制 
器 的 FSM 模型 。 在 这 个 模型 里 ,输入 的 集合 T= | x1， 
r2,r31 表 示 请 停 楼 层 。 比 如 说 ,r2 就 表示 第 二 层 请 停 。 
输出 的 集合 O= 142,a1,n,wul,u21 表 示 电 梯 运 行 的 方 
向 和 所 走 的 楼 层 数 。 比 如 说 ,d2 意味 着 电梯 应 该 癌 下 2 
层 ,u2 意味 着 电梯 应 该 向 上 2 层 , 而 ?意味 着 电梯 应 在 
原 位 置 保持 待命 。 在 图 2-3 中 可 以 看 到 ,如 果 当 前 楼 层 是 
第 2 层 ( 也 就 是 说 , 当前 状态 是 S, ) ,并 且 楼 层 1 请 停 , 那 ”图 2-3 电梯 控制 占 的 FSM 模型 
么 输出 就 为 41。 

有 两 种 类 型 的 FSM 是 人 们 极为 熟悉 的 : 即 基 于 迁移 的 FSM(Mealy 型 ) 和 基于 状态 的 





”FSM( Moore 型 ) ,它们 最 主要 的 区 别 就 在 于 对 输出 函数 的 定义 上 。 在 基于 迁移 的 FSM 中 ， 


输出 值 依赖 于 状态 和 输入 值 (h :Sx 了 I 一 0O); 但 是 在 基于 状态 的 FSM 中 ,输出 值 仅仅 依赖 于 
FSM 的 状态 (h: S 一 0O)。 换 句 话 说 ,在 基于 迁移 的 FSM 中 输出 与 迁移 有 关 ,而 在 基于 状态 的 
FSM 中 输出 与 状态 有 关 。 应 该 注意 到 图 2-3 中 使 用 了 基于 迁移 的 FSM 来 对 电梯 控制 器 建 
模 。 相 反 的 ,图 2-4 中 给 出 了 同一 个 电梯 控制 器 的 基于 状态 的 FSM 模型 ,在 该 模型 中 每 个 状 
态 都 表明 了 输出 值 。 | 





图 2-4 ”电梯 控制 器 的 基于 状态 的 FSM 模型 
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在 实际 情况 中 ,这 两 种 模型 的 主要 区 别 在 于 基于 状态 的 FSM 可 能 会 比 基 于 迁移 的 FSM 
需要 更 多 一 些 的 状态 。 这 是 因为 在 基于 迁移 的 模型 中 ,多 条 弧 可 以 指向 同一 个 状态 ,其 中 每 个 
弧 有 着 不 同 的 输出 值 ; 而 在 基于 状态 的 模型 中 ,每 个 不 同 的 输出 值 都 需要 它 自 己 的 状态 ,正如 
图 2-4 中 所 示 。 

在 FSM 必须 表示 整数 或 者 浮 点 数 的 情况 下 ,会 遇 到 状态 爆炸 的 问题 。 因 为 如 果 一 个 数 的 
每 个 可 能 的 值 都 需要 它 自己 的 状态 的 话 ,那么 FSM 将 会 需要 数目 巨大 的 状态 。 比 如 说 ,一 个 
16 位 的 整数 可 以 表示 22 或 者 65536 个 不 同 的 状态 。 然 而 有 一 个 相对 简单 的 方法 来 消除 状态 
爆炸 问题 ,因为 用 整数 或 者 浮 点 变量 来 扩展 FSM 是 可 能 的 ,因此 每 个 变量 可 以 表示 成 和 于 的 状 
态 。 比 如 说 ,引入 一 个 16 位 的 变量 就 可 以 将 FSM 中 的 状态 数 减少 65536 个 。 

这 种 扩展 的 FSM 被 称 为 带 数 据 通路 的 FSM (FSM with a datapath，FSMD ) , 文献 
[GDWL91] 将 其 描述 如 下 :定义 一 组 存储 变量 VAR ,一 组 表达 式 EXP = f(x, y, z,，…) | 
z, y, 2, "© VARI1, 以 及 一 组 存储 赋值 语句 A = |X<—e| XE VAR, eC EXP}, mE, €X 
一 组 状态 表达 式 STAT = | Rel(a,b)|a,6€C EXP | 来 表示 集合 EXP PMP RAR Z IA He 
辑 关 系 。 有 了 这 些 定义 ,FSMD 就 可 以 被 定义 为 如 下 的 五 元 组 。 

< S, IUSTAT, OUA, f,h > (2-2) 
其 中 ,输入 值 的 集合 经 扩展 可 以 包含 状态 表达 式 , 输 出 集合 经 扩展 已 包含 存储 赋值 语句 ,而 f 
和 4 分 别 被 定义 为 Sx(IUSTAT)->S Sx (IUSTAT)> (OU A 和 A) 之 加 的 映射 。 使 用 这 
种 FSMD ,我 们 可 以 将 图 2-3 中 的 电梯 控制 器 例子 模型 化 成 只 有 一 个 状态 ,如 图 2-5 中 所 示 。 
这 样 的 状态 数目 的 减少 是 可 行 的 , 因为 我 们 定义 了 一 个 变量 curr _ floor 来 存储 当前 楼 层 的 
值 ,这 样 就 消除 了 为 每 个 楼 层 都 分 配 一 个 状态 的 必要 。 


(curr_fioor he req_ficor) / output = req_floor — curr_fioor; curr_floor := req fioor 
start 
(cur_foor = req_floor) /output = 0 
图 2-5 电梯 控制 器 的 FSMD 模型 | 


一 般 来 说 ,FSM 适合 于 对 那些 控制 占 主 导 地 位 的 系统 建 模 ,而 FSMD 既 适 合 于 对 控制 占 
主导 地 位 的 系统 建 模 ,又 适合 于 对 计算 占 主导 地 位 的 系统 建 模 。 然 而 ,必须 指出 的 是 ,FSM 和 
FSMD 都 不 适合 于 复杂 系统 ,因为 这 两 者 中 没有 一 个 可 以 显 式 支 持 并 发 性 和 层次 性 。 大 没有 
对 并 发 性 的 显 式 支持 ,复杂 系统 将 会 酿 成 状态 数目 的 爆炸 。 比 如 说 可 以 考虑 一 个 由 两 个 并 发 
子 系统 所 组 成 的 系统 ,每 个 子 系统 含有 100 个 可 能 的 状态 。 如 果 我 们 试图 把 此 系统 表示 成 单 
一 的 FSM 或 者 FSMD 的 话 ,我 们 就 必须 表示 系统 所 有 的 可 能 的 状态 , 那 就 有 100 x 100 = 
10 000 个 。 同 时 ,由 于 缺少 层次 性 , 则 将 会 导致 弧 的 数目 的 增加 。 举 个 例子 ,如 果 有 100 个 状 
态 , 每 个 状态 都 要 求 有 自己 的 弧 来 表示 在 特定 的 输入 值 下 到 指定 的 状态 迁移 ,这 样 我 们 就 需要 
100 A&M ,相反 地 , 若 模 型 可 以 层次 化 地 将 这 100 个 状态 分 组 到 一 个 状态 中 ,就 只 需要 一 条 弧 。 
当然 ,这 类 模型 的 问题 是 当 它们 多 到 几 百 个 状态 或 者 纤 的 情况 下 ,人 们 就 很 难 理解 它们 了 。 


2.3.2 Petri 网 
Petri 网 (Petri net) | Pet81 5 Rei92] 模 型 是 另 一 种 类 型 的 面向 状态 的 模型 , 它 特 别 适 用 于 对 


那些 由 交互 的 并 发 任务 所 构成 的 系统 建 模 。Petri 网 模型 由 位 置 (Place) Æ it 43 (transition) # 
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以 及 标记 (token) 集 构成 。 标 记 放 置 于 位 置 中 ,一 旦 迁移 发 生 , 它 就 在 Petri 网 中 流动 并 被 接收 
或 是 产生 。 

更 形式 化 表示 ,Petri 网 是 一 个 五 元 组 : 

<P,T,1I,O,u> (2-3) 

其 中 ,P= 1p1，p2,…，pm| 是 一 组 位 置 ,T = {t1, 12,…, tn| 是 一 组 迁移 ,并 且 P 和 和 
下 没有 交集 。 而 后 ,输入 函数 1:T>P? ,定义 了 为 迁移 提供 输入 的 所 有 的 位 置 ,而 输出 函数 
O:T>P* ,定义 了 每 一 个 迁移 的 所 有 输出 位 置 。 换 句 话说 ,输入 和 输出 函数 明确 定义 了 位 置 
和 迁移 之 间 的 关联 关系 。 最 后 ,标记 函数 (marking function) u: P>N 定义 了 每 个 位 置 中 标记 
的 个 数 , 其 中 N 是 非 负 整数 集合 。 
在 图 2-6 中 ,我 们 看 到 Petri 网 的 图 形 表示 p2 
和 文字 表示 。 注 意 在 这 个 Petri 网 中 有 五 
个 位 置 (图 中 表示 为 圆 形 ) 和 四 个 迁移 (图 
中 表示 为 竖 线 段 )。 在 这 个 例子 中 ,位 置 
p2、p3 和 pS 给 迁移 12 提供 了 输入 ,而 
p3、p5 是 t2 的 输出 位 置 。 标 记 函 数 u 给 





Net=(P,T,1,O,u) 


P=(P}p2.p3.p4.P>3 
pl, p2, p5 各 分 配 了 一 个 标记 ,给 p3 分 配 came 
A Ee “不 y 一 T= . = U:u(pl}=1 
了 两 个 标记 ,因此 还 可 以 表示 为 u(p1， -|p2 pa.p9) OUD Pps) riaa 
p2, p3, p4, p5) = (1, l, 2, 0, 1). {tna Gt}, WPS 
如 上 面 所 提 到 的 , Petri 网 是 通过 
触发 (firing) 各 个 迁移 来 执行 操作 的 。 一 个 图 2-6 一 个 Petri 网 例子 


迁移 只 有 在 准备 好 的 情况 下 才 可 以 被 触发 一 一 也 就 是 说 , 它 的 每 一 个 输入 位 置 中 至 少 含 有 一 
个 标记 。 当 一 个 迁移 将 它 的 输入 位 置 中 所 有 的 标记 都 转移 走 ,并 且 为 每 一 个 它 的 输出 位 置 都 
放 入 一 个 标记 后 ,我 们 就 说 迁移 被 触发 了 。 比 如 说 在 图 2-6 中 ,在 迁移 i2 被 触发 后 ,标记 男 数 
u 就 变 为 (1,0,2,0,1)。 

Petri 网 之 所 以 有 用 是 因为 它们 可 以 有 效 地 模型 化 系统 的 多 种 特征 。 比 如 说 ,图 2-7a 显示 
顺序 性 (sequencing) 模 型 ,在 该 模型 中 迁移 t1 在 迁移 12 后 触发 。 在 图 2-7b 中 是 非 确 定性 
(non-deterministic) 分 支 的 模型 ,其 中 两 个 迁移 都 是 准备 好 的 但 是 只 有 一 个 才 会 触发 。 在 图 
2-7c 中 是 一 个 同步 (synchronization) 模 型 ,一 个 迁移 只 有 当 它 的 两 个 输入 位 置 都 含有 标记 时 才 
会 触发 。 图 2-7d 给 出 了 建立 资源 竞争 (resource contention) 模 型 的 方法 ,其 中 两 个 迁移 竞争 放 
置 在 中 间 的 位 置 之 中 的 同一 个 标记 。 在 图 2-7e 中 ,可 以 看 到 如 何 建立 并 发 性 (concurrency) 的 
模型 ,其 中 两 个 迁移 :2 和 13 可 以 同时 触发 。 更 确切 地 说 ,图 2-7e 建立 了 两 个 并 发 的 进程 模 
型 ;产生 者 和 消费 者 ;位 于 中 间 的 位 置 中 的 符号 由 12 产生 ,由 13 消费 。 

Petri 网 模型 可 以 用 来 检查 和 验证 某 些 实用 的 系统 性 质 ,比如 说 安全 性 和 活跃 性 。 例 如 ， 
安全 性 (safeness) , 指 的 是 Petri 网 保证 了 网 中 的 符号 数量 不 会 无 限 的 增长 的 特性 。 事 实 上 ,我 
们 不 能 构建 一 个 标记 个 数 无 限 多 的 Petri 网 。 另 一 方面 ， 活跃 性 (liveness) 指 的 是 Petri 网 保证 
至 少 有 一 个 迁移 可 以 触发 ,确保 其 无 死 锁 操作 的 特性 。 

虽然 Petri 网 在 建 模 和 分 析 并 发 系统 方面 有 着 许多 的 优势 ,但 是 它 同样 存在 着 类 似 于 


FSM 的 那些 局 限 性 :系统 复杂 度 的 增长 会 快速 导致 系统 的 不 可 理解 性 。 
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a) 顺序 性 b) 分 支 c) 同步 
+ tl 2 B t4 
d) 资源 竞争 e) 并 发 性 


图 2-7 Petri 网 的 多 种 表示 


2.3.3 层次 化 并 发 有 限 状态 机 

层次 化 并 发 有 限 状 态 机 (hierarchical concurrent finite-state machine，HCFSM) 本 质 上 是 
FSM 模型 的 扩展 , 它 在 FSM 模型 中 加 入 了 对 层次 (hierarchy) 和 并 发 (concurrency) 的 文 持 , 因 
此 消除 了 用 FSM 模型 来 描述 层次 化 的 和 并 发 的 系统 时 所 发 生 的 状态 和 弧 的 爆炸 的 可 能 性 。 

与 FSM 一 样 ,HCFSM 模型 由 一 组 状态 和 一 组 迁移 组 成 。 但 是 与 FSM 不 同 的 是 , HCF- 
SM 中 每 个 状态 可 以 进一步 的 分 解 为 一 组 子 状态 ,就 可 以 模型 化 层次 性 。 而 且 ,每 个 状态 也 可 
以 被 分 解 为 并 发 子 状 态 ,这 些 子 状态 并 行 执行 并 通过 全 局 变量 进行 通信 。 本 模型 中 迁移 既 可 
以 是 结构 化 的 也 可 以 是 非 结构 化 的 ,结构 化 的 迁移 只 能 在 同一 层次 上 的 两 个 状态 间 进 行 ,而 非 
结构 化 的 迁移 可 以 发 生 在 任意 的 两 个 状态 之 间 而 不 管 它们 的 层次 关系 。 

一 种 极其 适合 干 HCFSM 模型 的 语言 是 Statecharts[ Har87] ,因为 它 可 以 轻松 支持 并 发 状 
态 之 间 层 次 、 并 发 和 通信 的 概念 。Statecharts 使 用 了 非 结构 化 的 迁移 和 广播 通信 机 制 ,其 中 任 
一 个 给 定 状 态 所 产生 的 事件 都 会 被 其 他 所 有 状态 所 发 现 。 

Statecharts 语言 是 一 种 图 形 语言 。 其 特别 的 一 点 是 用 圆 角 矩形 来 表示 任意 层次 上 的 状态 ,用 
封装 来 表示 这 些 状 态 之 间 的 层次 关系 。 状 v 
态 间 的 虚线 表示 并 发 性 ,箭头 表示 状态 间 的 
迁移 ,每 个 箭头 上 都 标注 有 事件 ,并且 在 需 
要 时 标注 有 加 括号 的 条 件 和 /或 活动 。 

图 2-8 给 出 了 一 个 用 Statecharts 表示 
的 系统 的 例子 。 在 这 张 图 中 ,我 们 可 以 看 
到 状态 Y 分 解 成 了 两 个 并 发 的 状态 ,A 和 
D; 前 者 由 两 个 进一步 分 解 的 子 状态 B 和 C 
组 成 ,而 后 者 由 子 状态 上、\F 和 G Ak. Al 
中 的 黑 点 表示 状态 的 起 始点 。 根 据 State- 
charts 语言 描 述 , 当 状态 C 中 事件 4 RE, 图 2.8 Statechart: 层次 式 的 并 发 状态 
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则 A 将 转移 到 状态 B。 故 一 方面 ,如 果 状 态 B 中 事件 a 发 生 , 则 A 将 转移 到 状态 C ,但 是 仅 当 


条 件 P 在 事件 发 生 的 瞬间 成 立 。 在 B 到 C 的 迁移 过 程 中 ,与 迁移 有 关 的 活动 c 将 会 被 执行 。 

由 于 其 层次 性 和 并 发 性 构造 ,HCFSM 模型 极其 适合 于 表示 复杂 控制 系统 。 然 而 , 像 其 他 
的 面 问 状 态 的 模型 一 样 ,这 个 模型 的 问题 在 于 它 过 重地 集中 于 控制 的 模型 化 ,这 就 意味 着 它 只 
能 与 非常 简单 的 活动 (比如 说 赋值 语句 的 迁移 或 状态 ) 相 关联 。 因 此 ,HCFSM 并 不 适合 于 对 
复杂 系统 的 某 些 特性 建 模 ,它们 可 能 需要 复杂 的 数据 结构 或 是 可 能 在 每 个 状态 中 都 会 执行 任 
意 的 复杂 活动 。 对 于 这 些 系统 , 仅 靠 这 个 模型 锅 怕 不 能 胜任 。 


2.4 面向 活动 的 模型 


2.4.1 数据 流 图 

前 面 讨 论 了 面 问 状态 模型 最 稼 被 用 于 反应 系统 ,在 这 些 系统 中 系统 的 状态 随 着 外 部 事件 
而 发 生变 化 。 相 对 地 ,数据 流 图 (dataflow graphs, DFG)[DeM79，Dav83,GDW1L91] 则 主要 用 
于 传输 系统 ,在 这 些 系统 中 输出 是 通过 对 系统 输入 的 一 组 运算 而 得 到 的 。 因 而 ,DFG PRA 
状态 和 外 部 事件 来 触发 状态 的 变化 。 它 们 只 是 简单 地 由 表示 数据 流 的 弧 集 所 连接 的 活动 集 
(传输 ) 所 组 成 。 | 

更 确切 地 说 ,DFG 由 结 点 (node) 集 和 边 (edge) 集 所 组 成 。 在 数据 流 图 中 有 几 种 不 同类 型 
的 结 点 。 第 1 种 类 型 的 结 点 包括 输入 结 点 (input node) ,也 叫做 源 结 点 (source node) 和 输出 结 
点 (output node) ,也 叫做 目标 结 点 (destination node) ,它们 表示 输入 或 者 输出 的 数据 。 第 2 种 
类 型 是 活动 结 点 (activity node) ,也 叫做 进程 结 点 (process node), 它 表示 转移 或 者 操控 数据 的 
活动 。 这 样 的 活动 可 以 被 描述 为 一 段 程序 .一 个 过 程 .一 个 图 数 或 者 一 个 指令 ,甚至 是 一 个 算术 
运算 。 第 3 种 结 点 类 型 是 数据 存储 类 型 (data 
store type) , 它 表 示 数 据 存 储 的 不 同形 式 , 比 如 说 
是 数据 库 中 的 记录 ,操作 系统 中 的 文件 ,或 者 是 
内 存 或 寄存 器 中 的 一 个 变量 。 这 些 DFG 中 的 
多 种 结 点 通过 有 问 边 相互 连接 ,通常 这 些 有 问 
边 上 都 标 有 这 两 个 结 点 间 正 在 传送 的 数据 。 因 
此 每 个 活动 结 点 都 可 以 表示 成 另外 的 一 个 
DEFG, 因 此 这 个 模型 文 持 层 次 化 。 

通常 ,在 DFG WIE Zens PF Rw i 
出 或 输出 结 点 , 圆 形 表示 活动 结 点 ,不 闭合 的 
和 矩形 表示 数据 存储 结 点 。 数 据 流 表示 为 上 面 
标 有 相关 数据 的 弧 。 在 图 2-9a 中 给 出 了 一 个 
例子 。 这 个 例子 中 的 系统 由 两 个 活动 组 成 :Al 
和 A， ,后 者 被 进一步 的 分 解 为 活动 A21 ` Â2.2 
和 Az 3。 在 这 个 系统 中 ,数据 X 将 会 从 输入 
流 到 Ai ,而 数据 V 将 会 在 A1 处 计算 并 存储 到 
文件 中 去 。 而 后 数据 V 将 会 从 文件 中 取出 e279 seme 
#5 A, 所 产生 的 数据 Y 一 道 被 当 作 输入 送 











模型 与 体系 结构 17 


a 





给 A,。 数 据 Z 和 W 是 A, 产生 的 输出 。 
通过 将 不 同 的 对 象 与 图 中 的 结 点 和 边 相 关联 ,数据 流 模型 就 可 以 用 于 不 同 的 应 用 领域 ,或 
者 同一 领域 不 同 的 设计 阶段 ,因此 它 是 很 有 价值 的 。 比 如 说 ,在 数字 信号 处 理 领 域 ,数据 流 图 
中 的 结 点 可 以 表示 变量 或 者 算术 运算 ,例如 加 法 和 乘法 ,而 数据 流 边 可 以 用 来 表示 数据 相关 性 
(data dependency) ,如 图 2-9b 中 所 示 。 丰 这 个 例子 中 ,操作 “+ 与 数据 X 和 YY 相关 ,而 操作 
“x "与 数据 Z 和 操作 + "的 输出 相关 。 
值得 注意 的 是 ,在 不 同 活动 之 间 , 除 了 存在 问题 本 身 的 数据 相关 性 之 外 ,DFG 不 能 描述 其 他 
的 强加 操作 顺序 ,而 且 不 含有 关于 实施 过 程 的 任何 的 信息 。 基 于 这 些 原因 ,DFG 常用 于 系统 描述 
阶段 ,作为 设计 者 和 用 户 之 间 沟 通 的 手段 。 同 样 也 应 该 注意 到 ,因为 DFG 文 持 层次 分 解 , 所 以 这 
个 模型 也 适用 于 详细 说 明 复 杂 的 传输 系统 。 然 而 ,因为 这 个 模型 除了 它 的 数据 相关 性 之 外 没有 
表达 系统 的 任何 的 时 态 行 为 或 控制 活动 ,因此 它 在 对 内 其 系统 建 模 方面 还 存在 着 缺陷 。 


2.4.2 流程 图 

流程 图 (flowchart)[Dav83，Sod90 ] ,也 称 为 控制 流 图 (control-flow graph, CFG) ,是 一 种 与 
DFG 在 许多 方面 都 很 相似 的 面向 活动 的 模型 。 它 们 的 区 别 在 于 绝 的 意义 不 同 。 在 DFG Pol 
用 来 表示 数据 流 ,而 在 流程 图 中 则 表示 顺序 性 或 者 控制 流 。 流 程 图 与 FSMD 也 很 相像 ,这 两 
者 都 强调 了 系统 的 控制 方面 ,而 区 别 在 于 对 迁移 的 触发 机 制 不 同 :FSMD 中 的 迁移 是 通过 外 部 
事件 的 发 生来 触发 的 ,而 流程 图 中 的 迁移 是 当 一 个 具体 活动 完成 时 触发 的 。 

一 般 来 说 ,流程 图 由 结 点 集合 和 弧 的 集合 组 成 。 有 3 类 结 点 :第 1 类 是 起 始 结 点 (start 
node) 和 结束 结 点 (end node) ,它们 表明 了 流程 图 的 开始 点 和 结束 点 ;第 2 类 是 计算 结 点 (com- 
putation node) ,通过 赋值 语句 序列 定义 数据 的 传输 ;第 3 类 是 决策 结 点 (decision node) ,用 于 控 
制 分 支 。 流 程 图 中 的 不 同类 型 的 结 点 是 通过 有 向 边 来 相互 连接 的 ,它们 表明 了 结 点 执行 的 顺 
序 。 用 图 形 表示 的 话 , 流 程 图 使 用 圆 角 和 矩形 来 表示 起 始 结 点 和 结束 结 点 ,用 和 矩形 表示 计算 结 
点 ,而 用 菱形 方 框 表示 决策 结 点 。 图 2-10 给 出 了 流程 图 的 一 个 例子 , 它 是 用 来 计算 数组 
MEM 中 六 个 数 中 的 最 大 值 。 











<u> MA X=MEM(J) 


图 2-10 寻找 最 大 值 的 流程 图 表示 


当 需 要 把 系统 看 成 一 组 在 控制 流 管理 下 的 活动 序列 时 ,流程 图 就 很 实用 。 这 个 模型 适合 
于 那些 含有 已 定义 好 的 并 且 不 依赖 于 外 部 事件 的 任务 的 系统 。 当 我 们 需要 表示 是 然 的 数据 相 








| 32 | 
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关 性 时 ,该 模型 还 可 以 用 于 强加 一 个 特定 的 执行 顺序 给 DFG 中 的 活动 。 因 为 设计 者 强加 的 顺 
序 需 要 系统 遵循 某 一 特定 的 实施 方案 ,所 以 只 有 当 系 统 的 实施 方案 已 确定 的 情况 下 才能 使 用 
流程 图 模型 。 


2.5 面向 结构 的 模型 


组 件 连接 图 

组 件 连接 图 (component-connectivity diagram,CCD) 是 一 类 面向 结构 的 模型 ,它们 被 用 于 
描述 系统 的 物理 结构 而 不 是 功能 性 。DFG 
或 流程 图 表示 由 数据 或 者 控制 相关 性 所 连 
接 的 系统 活动 ,而 与 它们 不 同 的 是 ，CCD 
表示 系统 组 件 以 及 它们 的 互联 关系 。 换 句 
话说 , 它 对 系统 的 结构 视图 建 模 。 

CCD 也 是 由 结 点 集 和 边 集 构成 。 绪 点 
表示 不 同 的 组 件 (component), 这 些 组件 定 
义 为 结构 对 象 , 并 已 确定 其 输入 集 和 输出 
集 。 例 如 门 ALU bE RE FAS 


可 以 作为 组 件 。 而 边 则 表示 这 些 组 件 间 不 EAR 右 总 线 
同 的 连接 ,比如 说 总 线 和 连 线 。 

因为 CCD 允许 用 结 点 和 边 表示 不 同 的 
对 象 ,所 以 这 个 模型 可 以 用 于 表示 各 种 模 





型 。 比 如 在 图 2-11 中 ,CCD 在 三 个 不 同 的 
抽象 层次 上 例 化 ,产生 系统 框图 (system 
block diagram)、 寄 存 器 级 原理 图 (register- 
level schematic) 和 门 级 原理 图 (gate-level 
schematic)。 在 系统 框图 中 ,组 件 可 以 是 系 b) 寄存 器 级 原理 图 c) 门 级 原理 图 
统 级 模块 ,例如 处 理 器 、 存 储 器 或 ASIC. 
应 该 注意 这 些 组 件 之 间 的 连接 只 有 部 分 被 
表示 出 来 ,图 中 没有 包括 详细 的 连接 信息 , 像 数 据 总 线 的 宽度 和 特定 的 控制 信号 等 。 在 寄存 天 
级 结构 图 中 ,组 件 指 的 是 寄存 器 级 单元 ,比如 ALU 寄存 器 .选择 器 或 总 线 , 而 连接 则 和 定义 数据 
如 何在 这 些 算术 和 内 存 元 素 中 传输 。 在 这 种 类 型 的 原理 图 中 ,通常 控制 信号 并 不 表示 出 来 。 
而 门 级 原理 图 则 使 用 门 作为 组 件 , 即 门 元 件 。 而 且 这 些 元 件 之 间 的 连接 表示 实际 的 物理 连 线 。 
换 句 话说 ,数据 和 控制 连接 是 完全 指定 的 。 

由 于 组 件 连 接 模 型 特别 适合 于 表示 系统 的 结构 ,因此 常常 用 于 设计 过 程 的 后 一 阶段 ,设计 
者 需要 详细 描述 系统 的 实施 方案 。 


2.6 面向 数据 的 模型 





图 2-11 面向 结构 建 模 


2.6.1 实体 一 关系 图 
到 目前 为 止 ,我 们 讨论 了 面向 状态 的 模型 和 面 问 活动 的 模型 。 面向 数据 的 模型 与 它们 有 
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着 很 大 的 区 别 ,着 重 表示 数据 而 不 是 表示 处 理 数据 的 那些 活动 。 面 向 数据 的 模型 通常 用 于 信 
县 系统 的 设计 方面 ,因为 在 这 种 系统 中 数据 的 组 织 比 设计 的 其 他 方面 都 重要 。 面 向 数据 的 模 
型 的 一 种 表示 方法 是 所 谓 实体 一 关系 图 (entity-relationship diagram, ERD){ Che77, Teo90], È 
将 系统 定义 为 实体 以 及 实体 之 间 的 不 同 关系 。 

在 ERD 中 ,实体 表示 用 矩形 方 框 表示 ,而 其 关系 用 萎 形 方 框 表示 。 比 如 ,我 们 现在 想 要 表 
示 一 个 百货 公司 为 它 的 客户 订购 了 哪些 产品 这 个 信息 。 其 ERD 模型 需要 四 个 实体 : 
客户 (Customer) .购买 订单 (Order) 、 产 品 (Product) 及 供应 商 (Supplier) ,如 图 2-12 所 示 。 进 而 ， 
需要 表示 这 些 实体 之 间 的 关系 :客户 需要 哪些 产品 ,在 什么 时 间 给 某 产品 供应 商 一 份 订单 。 这 
些 关 系 遵循 下 列 规 则 :可 用 性 (Availability) 指 定 供应 商 和 它们 所 生产 的 产品 ;需求 (Request) 将 
客户 和 他 们 历 需 要 的 产品 联系 起 来 ; 产品 订单 将 一 种 特定 的 产品 和 它 的 特定 的 供应 商 和 客户 
订单 联系 起 来 。 





图 2-12 一 个 实体 一 关系 图 的 例子 


在 这 种 图 中 ,每 个 实体 都 有 一 个 唯一 类 型 的 数据 ,并 拥有 一 种 或 多 种 指定 的 属性 。 比 如 在 
百货 公司 销售 这 个 例子 里 ,实体 “客户 ”的 属性 可 能 是 每 个 客户 的 姓名 和 地 址 ,而 与 实体 “产品 ” 
相关 联 的 属性 则 是 每 个 产品 的 品名 和 价格 。 作 为 规则 ,每 个 关系 都 显示 出 了 它 所 关联 的 实体 
的 某 些 “事实 ” ,比如 说 关系 “订单 实例 ”就 给 出 了 这 样 的 信息 :哪个 客户 想 要 哪个 供应 商 的 什么 
产品 。 

因为 ERD 给 出 了 整个 系统 的 一 个 很 好 的 数据 视图 ,所 以 这 个 模型 特别 适合 于 想 要 组 织 多 
种 数据 之 间 的 复杂 关系 的 时 候 。 但 是 我 们 也 应 该 注意 到 ERD 模型 不 能 够 描述 系统 的 任何 功 
能 或 时 序 行为 。 


2.6.2 Jackson 

另外 一 种 面向 数据 的 模型 是 Jackson AA (Jackson’s diagram)[Sut88], 它 有 着 目 己 独特 的 优 
点 。 实 体 一 关系 图 只 倾向 于 强调 数据 的 属性 和 其 相互 关系 ,而 Jackson 图 对 每 一 个 数据 建 模 
的 方法 是 :利用 数据 的 结构 ,把 数据 分 解 成 子 数据 。 比 如 说 ,Jackson 图 很 适合 于 对 一 个 含有 多 
个 子 属 性 的 记录 建 模 。 事 实 上 ,Jackson 图 适合 于 那些 需要 进行 分 解 的 数据 ,而 这 些 数据 的 分 
解 方 式 会 比 那 些 适 合 简 单 记 录 的 方式 要 更 复杂 。 

Jackson 图 中 的 数据 通过 树 形 结构 进行 分 解 ， 在 树 形 结构 中 叶子 结 点 是 基本 数据 类 型 非 
叶子 结 点 是 通过 多 种 操作 像 组 合 (composition)(AND) , #4# (selection) (OR ) F Iž 4 (iteration) 
(* ) 而 得 到 的 复合 数据 类 型 。 组 合 操作 产生 了 包含 有 两 种 或 者 多 种 子 类 型 的 一 种 新 的 数据 类 


型 。 而 选择 操作 通过 在 这 些 子 类 型 中 选择 一 种 来 生成 它 自 己 的 数据 。 和 迭代 操作 则 通过 复制 它 
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(35) 的 子 类 型 中 的 菜 些 元 素来 生成 数据 。 


图 2-13 给 出 一 个 Jackson 图 的 例子 ,为 了 画面 对 象 (drawing object) 建 立 模 型 。 在 这 张 图 中 ， 
画面 表示 一 个 复合 数据 类 型 ,由 颜色 、 形 状 和 由 


“x "操作 表示 的 多 个 用 户 所 构成 。 此 外 ,每 个 用 ELE 

户 类 型 由 姓名 属性 组 成 ,而 每 个 形状 类 型 为 圆 或 

HIG, HIE, 矮 形 类 型 本 身 由 两 个 子 类 型 组 
成 :宽度 和 高 度 , 而 圆 类 型 只 有 一 个 子 类 型 : 半 CS 


4B 
. — al 矩形 名 
与 ERD 模 型 不 同 的 是 ;ERD 最 适合 于 表示 a| | ee 


有 复杂 关系 的 数据 ,Jackson 图 则 最 适合 于 表示 
有 着 复杂 复合 结构 的 数据 。 但 是 也 应 该 注意 到 ， 
这 个 模型 的 局 限 性 和 ERD 很 类 似 , 也 不 能 描述 ao 
E - Jackson 图 
系统 的 功能 性 或 时 序 行为 。 : 
2.7 异 构 模型 


2.7.1 控制 /数据 流 图 

控制 /数据 流 图 (control/data flow graph,CDFG)[OG86，LG88 |] 是 一 种 异 构 模 型 ,结合 了 
流程 图 CFG 和 数据 流 图 DFG 两 种 模型 的 优点 。 换 名 话说 ,CDFG 既 含 有 用 于 表示 活动 之 间 
的 数据 流 的 DEG, 又 含有 表示 DFG 的 顺序 关系 的 CEG。 因此 ,CDFG 模型 可 以 在 一 个 表示 中 
既 可 以 显 式 表示 数据 相关 性 ,又 可 以 显 式 表 示 系 统 的 控制 顺序 。 

图 2-14b 是 图 2-14a 中 描述 的 程序 的 CDFG 表示 。 应 该 注意 程序 语言 中 的 控制 结构 , 比 
如 case 语句 ,被 映射 成 了 控制 流 结 点 ,控制 流 构 造 之 间 的 赋值 语句 组 被 表示 成 了 DFG。 同 样 
值得 注意 的 是 ,CFG 和 DFG 用 虚线 连接 起 来 ,这 表示 DFG 中 的 哪个 活动 和 CFG 中 的 哪个 结 
点 有 关 。 一 旦 控制 转移 到 了 某 个 结 点 ,就 会 执行 与 其 相关 联 的 活动 。 

然而 ,CDFG 并 不 局 限于 表示 程序 设计 语言 中 的 控制 构造 和 赋值 语句 。 相 反 地 , 它 也 被 用 
于 表示 系统 需求 的 任何 复杂 活动 和 控制 行为 ,并 且 也 常用 于 实时 系统 的 设计 。 例 如 ,文献 
[WM85] 中 提出 的 模型 是 由 DFG 加 上 CFG 组 成 的 ,其 中 CFG 用 状态 机 模型 表示 。 在 这 个 系 
Bech CEG 可 以 响应 外 部 和 内 部 事件 ,也 可 以 通过 产生 控制 行为 来 控制 DFG 的 执行 ,比如 说 
可 以 开始 一 个 活动 或 者 停止 一 个 活动 。 

在 图 2-15 中 ,我 们 看 到 了 一 个 活动 级 别 CDFG 的 例子 。 根 据 这 个 描述 , 当 CFG 处 于 状态 
So 时 并 且 开 始 有 事件 发 生 , 则 活动 A; 和 A, 就 被 执行 ,系统 进入 状态 S1。 田 一 方面 , 当 CFG 
处 于 状态 S 并 且 有 事件 W= 10 发 生 , 则 活动 A 被 停止 ,活动 As 被 执行 ,系统 状态 迁移 到 
S,。 最 后 , 当 系 统 处 于 状态 S2 而 且 事 件 停 止 发 生 ,那么 活动 A; 和 As 被 停止 ， 系统 又 回 到 状 
态 Soo WXY WZ 表示 DFG 中 表示 的 多 个 活动 之 间 的 数据 流动 。 

CDFG 的 主要 的 优点 就 在 于 它 改进 了 DFG 不 能 够 表示 系统 控制 的 不 足 , 也 改进 了 CFG 
不 能 表示 数据 相关 性 这 个 不 足 。 总 之 , 它 近乎 完美 且 能 够 很 好 的 适用 于 许多 不 同 的 设计 领域 ， 
比如 说 实时 系统 和 ASIC[GDW191] 的 行为 综合 。 


2.7.2 结构 图 
由 Yourdon 和 Constantine 提出 的 结构 图 (structure chart) 模 型 TYC78] 是 另 一 种 异 构 模 
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case Cis 


A:=X+5; 


when 2 => 


when others 


end case; 


=> 各 :一 入 十 W 


a) 程序 代码 





b) CDFG 


图 2.14 控制 /数据 流 图 
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图 2-15 活动 级 CDFG 
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型 ,用 于 在 同一 个 表示 中 说 明 系 统 的 数据 活动 和 控制 访问 。 因 为 其 易于 理解 的 特点 ,这 种 结 





构图 对 于 程序 设计 者 来 说 是 很 有 用 的 。 

结构 图 是 由 结 点 集 和 边 集 组 成 。 结 点 表示 活动 , 边 表示 程序 设计 语言 中 的 过 程 调 用 或 者 
函数 调用 。 边 上 标 出 了 活动 中 传递 的 数据 。 而 活动 本 身 的 执行 控制 是 通过 控制 结构 集 来 搬 述 
的 ,包括 分 支 (branch) 、 和 迭代 (iteration) 和 子 程 序 调 用 (subroutine call). 

图 形 表 示 的 话 ,系统 中 的 所 有 的 活动 都 用 矩形 表示 ,而 这 些 活动 中 交换 的 数据 用 带 标号 的 
箭头 表示 。 结 构图 进一步 用 弧 表 示 活 动 之 间 的 过 程 调用 ,用 萎 形 符号 表示 分 文 结构 ,用 目 财 合 
I PEAR IE (RATS o | 

图 2-16 是 结构 图 的 一 个 例子 。 对 于 活动 的 顺序 ,模块 Main 首先 调用 模块 Get 来 获得 数 
据 A 和 B。Get 再 调用 Get_ A Ñ Get _B。 然 后 ,模块 Main 将 数据 A 和 数据 B 传送 到 变换 模 
Hk ,而 变换 模块 则 会 根据 某 些 条 件 , 或 者 调用 Change _ A 将 A 传送 到 A', 或 者 调用 Change_B 
模块 将 B 传送 到 B’。 当 从 传送 模块 Transform 获得 A’ Al Ba, HAR Main 就 会 将 这 些 数据 送 
到 Compute, 它 将 会 调用 两 个 循环 模块 :Loop1l 和 Loop2。 当 这 些 模块 完成 了 各 自 的 任务 后 ， 
Compute 模块 就 将 数据 C AD 返回 给 模块 Main ,进而 Main 将 数据 C 送 给 Out _ Co 


一 一 > 控制 Main 
o— 数据 c 


A,B 
A ~ On 
ABo | hoa ss 


Am 六 Q 
ad Non Hf `‘ 
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图 2-16 一 个 结构 图 的 例子 


如 同 CDFG 中 的 情况 ,结构 图 既 可 以 表示 控制 信息 又 可 以 表示 数据 信息 。 但 是 ,应 该 注 
意 到 结构 图 并 没有 完全 说 明 执 行 顺序 。 比 如 说 ,我 们 不 知道 Get _ A 和 Get _ B 被 调用 时 的 顺 
序 ,这 些 模块 的 执行 顺序 是 由 数据 相关 性 来 约束 的 。 另 一 方面 ,结构 图 可 以 表示 模块 之 间 分 
支 . 凌 代 和 过 程 调用 上 强加 的 控制 。 由 于 它 可 以 在 某 种 程度 上 描述 执行 的 顺序 ,因此 结构 图 主 
要 用 于 设计 顺序 程序 的 预备 阶段 。 
2.7.3 程序 设计 语言 模式 

与 结构 图 一 样 ,程序 设计 语言 (programming language) 也 可 以 作为 支持 数据 、 活动 和 控制 
建 模 的 异 构 模 型 。 但 是 与 结构 图 不 同 的 是 ,程序 设计 语言 使 用 的 是 文本 表示 形式 而 不 是 图 形 
形式 。 

程序 设计 语言 有 两 种 主要 的 类 型 :命令 式 语言 (imperative language) 和 声明 式 语 言 (declar- 
ative language)。 命 令 式 语言 包括 像 C 和 Pascal 这 样 的 语言 ,它们 使 用 执行 的 控制 驱动 模型 ， 
其 中 的 语句 按照 程序 中 的 顺序 进行 执行 。 而 LISP 和 PROLOG 属于 声明 式 语言 ,因为 它们 通 
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过 和 需求 驱动 或 者 模式 驱动 的 计算 来 对 执行 建 模 。 这 两 种 类 型 的 语言 的 主要 区 别 在 于 :声明 式 
语言 没有 显 式 给 出 执行 顺序 ,而 是 着 重 于 通过 函数 集 或 者 逻辑 规则 来 定义 计算 的 目标 。 

在 数据 建 模 方面 ,类似 于 Jackson 图 ,命令 式 程序 设计 语言 也 提供 了 多 种 数据 结构 ,包括 : 
基本 数据 类 型 ,如 整 型 和 实 型 ;复合 数据 类 型 ,如 数组 和 记录 。 程 序 设计 语言 通过 语句 来 对 小 
型 活动 建 模 ,而 将 大 型 活动 通过 函数 或 过 程 建 模 。 气 数 或 过 程 同 时 作为 支持 系统 层次 化 的 一 
种 机 制 。 这 些 程序 设计 语言 通过 控制 结构 详细 规定 了 活动 执行 顺序 ,建立 控制 流 模型 。 控 制 
结构 包括 顺序 组 合 (常用 分 号 标识 )、 分 支 (if 和 case 语 句 ) MIR (while, for 和 repeat) 以 及 子 程 
序 调用 。 

使 用 命令 式 程序 设计 语言 的 优点 在 于 它 很 适合 于 对 计算 占 主导 地 位 的 行为 建 模 。 在 这 些 
行为 中 一 些 问题 是 通过 算法 的 运用 来 解决 的 ,比如 说 我 们 想 要 对 一 个 数组 中 的 各 个 数 进行 排 
序 。 

一 些 程序 设计 语言 ,比如 像 通信 顺序 进程 (communicating sequential process， CSP) [ Hoa78, 
Hoa85] ADA 和 VHDL, 是 为 了 支持 并 发 执行 而 发 展 起 来 的 。 这 些 语言 使 用 不 同 的 通信 机 制 。 
在 CSP 中 ,并 发 进程 之 间 的 通信 采用 消息 传递 (message passing) 方 式 , 数 据 从 一 个 进程 经 由 通 
(RIA BATHE. TE ADA 中 ,并 发 任务 通信 是 利用 约会 (rendezvous) 方 式 实现 ,每 个 任 
务 需 要 在 某 个 同步 点 上 等 待 其 他 任务 传 来 的 数据 。 最 后 ,在 VHDL 中 并 发 进程 之 间 通 信 通 过 A | 
共享 内 存 (shared memory) 实 现 , 即 不 同 的 进程 对 全 局 信和 号 进行 读 写 操作 。 

虽然 程序 设计 语言 非常 适合 对 系统 的 数据 、 活 动 和 控制 机 制 建 模 ,但 是 其 最 大 问题 在 于 并 
没有 显 式 对 系统 状态 建 模 ,对 于 租 人 式 系 统 的 建 模 是 个 不 利 因素 。 


2.7.4 面向 对 象 的 模型 

面向 对 象 的 模型 (object-oriented model )[Boo91] 是 由 面向 数据 的 模型 发 展 而 来 , 它 的 特点 
是 趋向 于 将 系统 看 成 一 组 对 象 (object)。 对 于 这 个 模型 ,每 个 对 象 是 由 一 组 数据 (data) 和 一 组 
变换 数据 的 操作 (operation) 组 成 的 。 在 某 些 方面 ,面向 对 象 的 模型 很 像 由 实体 组 成 的 实时 系 
统 , 因 为 每 个 系统 中 的 实体 通常 含有 一 组 定义 好 的 操作 ,实体 可 以 通过 这 些 操 作 与 其 他 的 实体 
进行 交互 作用 ,来 完成 其 他 实体 要 求 的 服务 。 

面向 对 象 模型 有 几 个 其 他 模型 不 具有 的 特点 。 首 先 ,它们 能 通过 将 数据 封装 在 对 象 中 并 
且 使 数据 对 于 其 他 对 象 不 可 见 来 支持 数据 抽象 (data abstraction) 或 者 信息 隐藏 (information 
hiding)。 这 个 特点 意味 着 当 一 个 对 象 想 要 改变 其 他 对 象 中 的 数据 时 ,前 者 必须 请 求 后 者 的 服 
务 。 因 为 此 项 要 求 ,一 个 对 象 中 的 内 部 变化 不 会 影响 到 系统 中 的 其 他 对 象 。 除 此 之 外 , 面 加 对 
象 模型 同样 能 够 用 一 种 自然 的 方式 来 表示 并 发 性 (concurrency) ,因为 任何 一 个 对 象 都 是 作为 
系统 的 一 个 组 成 部 分 被 创建 并 且 要 在 它 的 生存 期 内 与 其 他 对 象 共 同 存在 ,同时 还 要 执行 独立 
于 其 他 对 象 的 任务 。 

ER 2-17 中 ,我 们 可 以 看 到 ,除了 它 的 对 象 以 外 ,系统 还 要 包括 一 组 转换 ,用 于 定义 随时 
间 变 化 的 系统 行为 。 正 如 上 面 所 说 ,这 些 迁 移 不 能 直接 改变 数据 ,只 能 由 每 个 对 象 来 请 求 这 些 
改变 所 需要 的 特定 操作 。 

很 明显 ,面向 对 象 的 模型 有 许多 优点 。 然 而 ,系统 设计 者 有 时 会 发 现 对 于 需要 复杂 转换 函 
数 的 系统 来 说 ,这 个 模型 有 些 不 尽 如 人 意 ,除非 再 补充 一 些 可 以 足够 表示 这 些 转换 的 其 他 模 
型 。 








24 第 2 日 





图 2-17 带 有 对 象 和 转换 函数 的 系统 


2.7.5 程序 状态 机 

程序 状态 机 (program-state machine, PSM)[GVN94,VNG91|] 是 男 一 种 异 构 模型 , 它 综合 
了 HCFSM 和 程序 设计 语言 范式 。 这 个 模型 基本 上 巾 层 次 化 的 程序 状态 (program-state) 组 成 ， 
其 中 每 个 程序 状态 表示 一 个 计算 的 独特 的 模型 。 在 任何 给 定 的 时 间 里 ,只 有 程序 状态 的 一 个 
子 集 处 于 活路 状态 ,比如 ,执行 它们 的 计算 任务 。 

在 这 一 模型 的 层次 结构 中 , 既 含 有 复合 程序 状态 又 含有 叶子 程序 状态 。 复 合 程 序 状态 可 
以 进一步 被 分 解 为 或 者 并 发 或 者 顺序 的 程序 子 状态 。 如 果 是 并 发 的 ,那么 只 要 程序 状态 处 于 
活跃 状态 , 则 其 所 有 的 程序 子 状 态 也 是 活跃 的 状态 。 如 果 是 顺序 的 , 则 当 程 序 状态 活跃 时 , 程 
序 子 状态 只 是 活跃 一 次 。 上 顺序 分 解 的 程序 状态 包含 一 一 组 迁移 弧 ,它们 表示 这 些 程序 子 状态 间 


的 顺序 关系 。 一 共存 在 两 种 迁移 弧 。 第 1 种 ,完成 时 迁移 弧 ( transition-on-completion arc, 


TOC) ,只 有 当 源 程序 子 状态 完成 了 它 的 工作 以 及 相关 的 弧 的 条 件 成 立 的 时 候 , 它 才 进 行 迁 移 。 
第 2 Bh, st Bp it 4$ 9h (transition-immediately arc, TI) ,无 论 何 时 只 要 弧 的 条 件 成立 就 可 以 进行 
迁移 ,而 不 必 考 虑 源 程序 子 状态 是 否 完成 了 计算 。 在 层次 结构 的 最 低层 ,是 叶子 程序 状态 , 它 
的 计算 是 通过 程序 设计 语言 语句 进行 描述 的 。 

当 采 用 程序 状态 机 模型 时 ,系统 作为 一 个 实体 图 形 化 地 表示 为 矩形 方 框 , 而 实体 中 的 程序 
状态 表示 成 带 圆 角 的 矩形 方 框 。 程 序 子 状态 之 间 的 并 发 关系 用 虚线 表示 。 迁 移 用 有 向 箭 头 表 
示 。 起 始 状 态 用 三 角形 表示 ,单个 程序 状态 的 完成 用 一 条 指向 完成 点 的 迁移 弧 来 表示 ,完成 点 
用 一 个 放 在 状态 中 的 小 方块 来 表示 。TOC 弧 起 始 于 源 子 状态 中 的 小 方 框 ,而 TI 弧 则 起 始 于 
源 子 状态 的 边界 。 

图 2-18 给 出 了 一 个 程序 状态 机 的 例子 , 它 由 根 状态 Y 组 成 ,而 了 本 身 又 是 由 两 个 并 发 子 
状态 A 和 构成 。 状 态 A 包含 两 个 顺序 子 状态 B 和 C。 虽 然 图 中 只 给 出 了 状态 D 的 程序 ， 
但 是 应 该 注意 到 状态 B.C 和 DD 都 是 叶子 状态 。 根 据 上 面 给 出 的 图 形 符号 ,我 们 可 以 看 到 标 
有 el 和 e3 MIME TOC M, ,而 标 有 e2 的 弧 是 TIE 弧 。 弧 的 配置 可 能 意味 着 当 状 态 B 结束 而 
日 条 件 el 成 立时 ,控制 将 转移 到 状态 C。 然 而 ,如 果 条 件 e2 在 状态 C 中 成 立时 , 则 不 管 C 是 
否 完成 都 会 将 控制 转移 到 状态 B。 

由 于 PSM 可 以 在 单一 模型 里 表示 系统 的 状态 、 数 据 和 活动 ,所 以 它 比 HCFSM 更 适合 于 
对 那些 有 着 复杂 数据 和 活动 且 与 每 个 状态 相关 的 那些 系统 建 模型 。PSM 还 可 以 克服 程序 设 
计 语 言 的 最 大 障碍 ,因为 它 可 以 显 式 表示 状态 。 它 允许 设计 者 使 用 层次 化 状态 分 解 方法 来 描 
述 系 统 , 直 到 觉得 使 用 程序 结构 比较 方便 。 程 序 设 计 语 言 模型 和 HCFSM 模型 是 PSM 模型 的 
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variable A:array[1..20]of integer 
: D 


variable i,max:integer: 


max=0; 
for 1=1 to 20 do 


if(A [i] > max)then 
max=A[i]'; 
end if; 
end for 





图 2-18 程序 状态 机 例子 


两 个 极端 :程序 可 以 看 成 是 只 有 一 个 叶子 状态 包含 语言 结构 的 PSM 模型 ;HCFSM 可 以 看 成 
是 PSM 模型 中 的 所 有 叶子 状态 都 不 含有 语言 结 构 。 


2.7.6 队列 模型 

队列 模型 (queueing model) [Gif78] 与 我 们 前 面 提 到 的 模型 有 一 些 不 同 之 处 ,主要 在 于 那 
些 模 型 是 用 于 系统 设计 的 ,而 队列 模型 是 用 于 分 析 系 统 的 。 比 如 说 , 当 我 们 想 要 找到 系统 性 能 
或 者 资源 的 瓶颈 的 时 候 ,就 可 以 使 用 队列 模型 。 | 

队列 模型 的 特别 之 处 在 于 它 将 系统 描述 成 队列 ”到达 ”队列 服务 器 
(queue) 和 服务 器 (server) 的 一 个 网 络 。 到 达 的 请 求 都 被 存 
放 在 队列 之 中 等 待 着 服务 器 的 处 理 。 在 图 2-19a 和 b 的 例 
子 中 ,分 别 为 有 一 个 服务 器 和 多 个 服务 器 的 队列 模型 。 

队列 模型 的 价值 在 于 它们 提供 了 对 于 解决 系统 问题 很 
有 必要 的 数学 分 析 的 基础 。 比 如 说 ,如 果 我 们 知道 系统 的 
某 些 特征 , 像 服务 器 的 数目 .队列 的 类 型 ,两 个 连续 到 达 的 
请 求 之 间 的 时 间 间 隔 以 及 一 个 请 求 需要 的 服务 时 间 ,那么 
队列 模型 可 以 提供 更 进一步 的 信息 , 像 利 用 率 (服务 器 繁忙 
时 间 所 占 比 例 ) .队列 长 度 ( 队 列 中 等 待 的 平均 请 求 数目 ) 和 
香 吐 率 ( 请 求 通过 服务 器 的 速率 ) 等 。 设 计 者 们 可 以 利用 这 
些 新 的 信息 来 定位 系统 中 的 瓶颈 位 置 。 图 2-19 ”队列 模型 

应 该 注意 到 ,不 同 的 模型 需要 不 用 类 型 的 数学 分 析 。 
某 些 模 型 ,比如 说 只 有 单一 服务 器 和 单一 队列 的 模型 ,只 需 
要 相对 简单 的 技术 ,而 其 余 的 模型 则 需要 更 为 复杂 的 技术 ,更 有 一 些 模型 几乎 不 太 可 能 作 定 量 
的 分 析 。 

作为 实例 ,下 面 分 析 有 单一 服务 器 和 单一 队列 的 模型 。 为 了 进行 数学 分 析 来 确定 系统 的 
行为 ,必须 了 解 模型 的 几 个 参数 。 比 如 ,必须 知道 两 个 连续 到 达 的 请 求 之 间 的 时 间 间 隔 , 也 要 


Ñi 
% 


a) 单一 服务 端 





b) 多 个 服务 端 
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知道 每 个 请 求 所 需要 的 服务 时 间 。 用 适当 分 布 的 随机 变量 建立 这 两 个 时 间 模 型 是 可 能 的 , 正 


如 这 个 例子 中 相互 到 达 的 时 间 和 服务 时 间 假 设 成 指数 分 布 。 在 这 个 例子 里 ,如 果 平 均 的 到 达 
时 间 间 隔 为 ,而且 平均 服务 时 间 为 5&, 当 > ,就 可 以 到 达 一 个 稳定 的 队列 ,因为 它 可 以 如 
免 有 太 多 的 请 求 在 队列 里 等 候 。 然 而 , 当 ) 委 A, 队 列 将 会 不 稳定 ， DATO FS APRS Se 
间 。 读 者 可 以 参考 [Gif78，Laz84] 中 关于 队列 模型 的 进一步 的 分 析 技 术 。 


2.8 体系 结构 分 类 


目前 为 止 ,我 们 已 经 阐明 了 各 种 模型 如 何 描述 系统 的 功能 性 、 数据、 控制 和 结构 。 这 里 再 
介绍 作为 描述 模型 的 体系 结构 , 它 详细 说 明 系 统 在 实际 中 是 如 何 实现 的 。 体 系 结构 的 作用 就 
是 描述 组 件 的 数 晤 .每 个 组 件 的 类 型 和 这 些 系 统 中 不 同 组 件 之 间 所 有 连接 的 类 型 。 

体系 结构 的 范围 可 以 从 简单 的 控制 器 一 直到 大 规模 并 行 处 理 器 。 然 而 ,尽管 存在 多 样 性 ， 
体系 结构 还 是 可 以 分 成 几 个 不 同 的 类 别 , 即 (1) 专 用 体系 结构 (application-specific architec- 
ture) ,如 DSP 系统 ;(2) 通 用 处 理 器 (general-purpose processor) ,如 RISC;(3) 并 行 处 理 器 (paral- 
lel processor) ,如 SIMD 机 和 MIMD 机 。 ` 


2.9 专用 体系 结构 


2.9.1 控制 器 体系 结构 

最 简单 的 专用 体系 结构 就 是 控制 器 类 , 它 直 接 实现 2.3. 1 节 讲 到 的 用 五 元 组 < S I, O, 
f, 户 > 定 义 的 有 限 状态 机 模型 。 如 图 2-20 所 示 ,控制 

器 由 一 个 寄存 器 和 两 个 组 合 模 块 组 成 。 这 个 寄存 侨 ， 

通常 叫做 状态 寄存 器 ,用 来 存储 S 中 的 状态 ,而 两 个 
组 合 模块 ,分别 表示 次 态 函 数 和 输出 函数 ,实现 函数 f 
和 有 hh。 输入 和 输出 则 表示 由 集合 I 和 OO 定义 的 布尔 信 
号 。 | 

如 前 所 述 , FEES AG |) SS E la. ETE 
基于 迁移 的 和 基于 状态 的 。 这 些 控制 器 类 型 不 同 之 处 图 2-20 通用 FSM 框图 
在 于 它们 是 如 何 定 义 输出 函数 h 的 。 对 于 基于 迁移 的 控制 器 ,h 被 定义 为 一 个 Sx [一 O 的 
映射 ,这 就 意味 着 输出 函数 和 两 个 参数 有 关 , 即 状态 寄存 器 和 输入 。 而 另 一 方面 ,对 于 基于 状 
态 的 控制 器 ,h 被 定义 为 S 一 O 的 映射 ,这 就 意味 着 输出 函数 只 依赖 于 一 个 允 
器 。 因 为 输入 和 输出 都 是 布尔 信号 ,所 以 对 于 这 两 种 情况 ,这 个 体系 结构 很 适合 于 实现 那些 不 
需要 复杂 数据 操作 的 控制 器 。 控 制 器 综合 包括 状态 最 小 化 编码 布尔 最 小 化 ,以 及 对 次 态 函 
数 和 输出 函数 的 映射 技术 。 


2.9.2 数据 通路 体系 结构 

数据 通路 体系 结构 用 于 许多 需要 在 不 同 的 数据 集合 上 重复 执行 固定 计算 的 应 用 中 , 比如 
说 在 数字 信号 处 理 (digital signal processing ,DSP) 系 统 中 用 于 数字 滤波 、 图 像 处 理 和 视频 压 
缩 。 数 据 通路 体系 结构 常常 由 高 速 的 算术 单元 组 成 ,而 且 通 过 并 行 连接 并 大 量 采 用 流水 线 技 
术 来 达到 高 的 吞吐 率 。 

在 图 2-21 中 ,我 们 可 以 看 到 两 个 不 同 的 数据 通路 ,分 别 用 于 实现 有 限 脉 冲 啊 应 (finite-im- 






状态 寄存 器 | 
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pulse-response) 滤 波 器 (FIR) , 它 由 下 面 表 达 式 定义 。 


yi) = X zli- k)b(k) 


k=0 


x(1) bO = x(i-1) bl) x(i-2) b2) x(i-3) (3) 








x(i) BO XmlD MD Xi-2) b2) x(i-3) 3) 





y(i) 


| 
| 
l 
l 
| 
| 
l 
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b) 四 级 流水 
图 2-21 FIR 滤波 器 的 两 种 不 同 数据 通路 


其 中 六 等 于 4。 应 该 注意 图 2-21a 中 数据 通路 并 发 地 实现 了 所 有 的 乘法 操作 ,并且 通 过 
求 和 树 将 乘积 并 行 相 加 。 图 2-21b 中 的 数据 通路 同样 并 发 实现 乘法 操作 ,所 不 同 的 是 之 后 对 
乘积 项 顺序 相 加 。 此 外 ,注意 图 2-21a 中 的 数据 通路 有 3 级 流水 ,每 步 都 用 虚线 标 出 ;而 图 
2-21b 中 的 数据 通路 有 4 级 相似 的 流水 。 虽 然 这 两 个 数据 通路 都 使 用 4 个 乘法 器 和 3 个 加 法 
器 ,但 是 图 2-21b 中 数据 通路 更 规则 ,而 且 用 ASIC 技术 更 容易 实现 。 | 

在 这 种 体系 结构 中 ,只 要 算法 中 的 每 个 操作 都 通过 本 身 的 单元 实现 (如 图 2-21 中 所 示 )， 
就 不 需要 系统 控制 ,因为 数据 只 是 简单 地 从 一 个 单元 流 问 下 一 个 单元 ,并 且 时 钟 用 来 加 载 流水 
寄存 器 。 然 而 ,有 些 时 候 , 需 要 减少 单元 的 使 用 量 以 便 节 省 硅 片 面积 。 在 这 种 情况 下 ,需要 有 
简单 的 控制 器 来 控制 数据 在 单元 和 寄存 器 间 的 传输 ,并 且 要 为 那些 在 不 同时 间 执 行 不 同 郴 数 
的 单元 来 选择 合适 的 代数 函数 。 另 一 种 情况 是 ,对 于 同一 个 数据 通路 可 能 实现 多 于 一 个 不 同 
算法 ,并且 每 个 算法 在 不 同时 间 执 行 。 在 这 种 情况 下 ,因为 每 个 算法 都 需要 一 个 独特 的 数据 流 
来 流 过 数据 通路 ,所 以 我 们 需要 控制 器 来 管理 数据 流 。 这 样 的 控制 器 通常 很 简单 而 且 没 有 条 
{FAP ZX 0 | 
一 般 来 说 ,数据 通路 体系 结构 常用 ASIC 实现 。 一 个 代价 较 少 的 解决 方案 是 使 用 出 售 的 
DSP 处 理 器 ,其 数据 通路 由 一 个 乘法 器 和 一 个 累加 器 构成 。 这 种 DSP 处 理 器 通常 有 一 个 模拟 
接口 ,在 一 个 芯片 上 带 有 A/D 和 D/A 转换 器 。 同 样 , 它 通常 对 于 指令 和 数据 有 各 自 的 总 线 ， 
所 以 读 取 指 令 和 访问 数据 可 以 并 发 进行 ,因此 可 以 得 到 较 高 的 吞吐 率 。 在 某 些 情况 下 , 它 也 许 
有 预先 编程 好 的 ROM 来 执行 标准 化 函数 ,比如 说 傅 里 叶 变 换 和 数学 滤波 。 





50 | 





28 第 2 章 


2.9.3 市 数据 通路 的 有 限 状 态 机 

带 数 据 通路 的 有 限 状 态 机 (finite-state machine with datapath ,FSMD) 是 一 种 综合 了 FSM 
控制 器 和 数据 通路 的 体系 结构 ,正如 图 2-22 中 的 方 框图 所 示 。 值 得 注意 控制 单元 包含 一 个 状 
态 和 寄存 器 和 两 个 组 合 模块 ,分别 表 示 次 态 函 数 和 输出 函数 。 数 据 通路 本 身 包含 的 功能 单元 有 
ALU 乘法 器 和 移 位 器 ,存储 组 件 ( 像 寄 存 器 和 存储 器 ) 等 ,以 及 用 于 连接 这 些 不 同 的 组 件 的 选 
择 器 和 总 线 。 控 制 单元 的 输入 是 数据 通路 的 状态 信号 ,而 输出 是 用 于 控制 数据 通路 中 的 功能 
或 存储 组 件 的 控制 信号 。 数 据 通路 的 输入 和 输出 都 连接 至 一 个 或 多 个 存储 器 , 提供 数据 通路 
中 计算 所 用 的 数据 以 及 存储 结果 数据 。 


数据 通路 输入 





数据 通路 输出 
图 2-22 通用 FSMD 框图 


作为 一 个 通用 体系 结构 ,FSMD 用 于 不 同 的 ASIC 设计 。 上 述 FSM 控制 器 和 DSP 数据 通 
路 是 这 种 体系 结构 的 两 个 特例 。 除 此 之 外 ,FSMD 还 是 通用 处 理 器 的 基本 体系 结构 ,因为 每 个 
处 理 器 除了 数据 和 程序 存储 器 之 外 ,还 包括 一 个 控制 单元 和 数据 通路 。 


2.10 处 理 希 


2.10.1 复杂 指令 集 计 算 机 

开发 复杂 指令 集 计算 机 (complex-instruction-set computer, CISC) 的 体系 结构 最 主要 的 目 
的 是 为 了 减少 编译 代码 中 指令 的 数目 ,使 取 指令 操作 所 需要 的 内 存 访 问 数量 达到 最 小 化 。 在 
过 去 这 个 目的 很 有 根据 ,因为 内 存 价格 贵 而 且 比 处 理 器 速度 慢 。 开 发 CISC 的 第 二 个 目的 是 
简化 编译 器 结构 , 它 在 处 理 器 指令 集中 包含 了 类 似 于 程序 设计 语言 结构 的 复杂 指令 。 这 些 复 
杂 指 令 减 少 了 程序 设计 语言 和 机 器 语言 之 间 的 语义 差别 ,而 且 简 化 了 编译 器 的 构造 。 

为 了 支持 复杂 指令 集 ,CISC 通常 有 一 个 同样 复杂 的 数据 通路 ,以 及 一 个 微 程 序 控制 器 , 如 
图 2-23 所 示 。 该 控制 器 又 由 一 个 微 程序 内 存 、 一 个 微 程序 计数 器 (MicroPC) 和 地 址 选择 逻辑 
构成 。 在 微 程序 内 存 中 的 每 一 个 字 都 表示 一 个 控制 字 , 并 且 包 含 了 一 个 时 钟 周期 内 所 有 数据 
通路 控制 信号 的 值 。 这 就 意味 着 控制 字 中 的 每 一 位 表示 一 个 数据 通路 控制 线 的 值 ,例如 它 可 
以 用 于 加 载 寄存 器 或 是 选择 ALU 中 的 一 个 操作 。 此 外 ,每 个 处 理 器 指令 都 由 一 系列 的 控制 
字 组 成 。 当 从 内 看 中 取出 这 样 的 一 条 指令 时 ,首先 把 它 放 在 指令 寄存 器 中 ,然后 地 址 选择 还 辑 
再 根据 它 来 确定 微 程序 内 存 中 相应 的 控制 字 顺 序 的 起 始 地 址 。 当 把 该 起 始 地 址 放 入 MicroPC 
中 后 ,就 从 微 程 序 内 在 中 找到 相应 的 控制 字 , 并 利用 它 在 数据 通路 中 把 数据 从 一 个 寄存 器 传 送 
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到 为 一 个 寄存 器 。 因 为 MicroPC 中 的 地 址 并 发 递增 来 指向 下 一 个 控制 字 , 因 此 对 于 序列 中 的 
每 个 控制 字 都 会 重复 一 这 这 一 步 号 。 最 终 , 当 执行 完 最 后 一 个 控制 字 时 ,就 从 内 存 中 取出 一 条 
新 的 指令 ,整个 过 程 将 会 重复 进行 。 





图 2-23” 微 程 序 控制 的 CISC 


由 此 可 见 ,控制 字 的 数量 以 及 时 钟 周 期 的 数目 对 于 每 一 指令 都 可 以 是 不 同 的 。 因 此 ,在 
CISC 中 很 难 实现 指令 流水 操作 。 另 外 ,速度 相对 较 慢 的 微 程序 存储 器 需要 一 个 比 必 要 时 间 要 
长 的 时 钟 周期 。 因 为 指令 流水 和 短 的 时 钟 周期 都 是 快速 执行 程序 的 必要 条 件 , 因 此 CISC 体 
系 结构 对 于 高 效 处 理 器 来 说 是 不 太 适 合 的 。 

虽然 CISC 体系 结构 可 以 执行 不 同 的 复杂 指令 ,但 是 程序 执行 的 统计 数据 表明 :最 常用 的 
指令 都 很 简单 ,而 且 只 含有 少量 几 种 寻 址 方式 和 数据 类 型 。 统 计数 据 同时 也 表明 ,大 部 分 的 复 
杂 指 令 很 少 或 者 根本 不 会 被 使 用 。 导 致 复杂 指令 使 用 较 少 的 原因 是 程序 设计 语言 结构 和 所 使 
用 的 复杂 指令 之 间 存 在 微小 的 语义 差别 ,以 及 将 程序 结构 映射 到 这 样 的 复杂 指令 时 所 面临 的 
问题 。 由 于 这 个 问题 的 存在 ,复杂 指令 在 CISC 体系 结构 的 优化 编译 器 中 很 少 被 使 用 ,因此 也 
降低 了 CISC 体系 结构 的 实用 性 。 

内 存 价 格 的 稳定 下 降 和 速度 的 提高 使 得 程序 代码 紧密 优化 和 复杂 指令 集 对 于 高 效 计算 来 
说 是 不 必要 的 。 此 外 ,复杂 指令 集 使 得 CISC 体系 结构 的 优化 编译 器 的 构造 成 本 太 高 。 基 于 
这 两 个 原因 ,CISC 体系 结构 被 下 一 节 将 要 阐述 的 RISC 体系 结构 所 替代 。 


2.10.2 精简 指令 集 计 算 机 
相对 于 CISC 体系 结构 ,精简 指令 集 计算 机 (reduced-instruction-set computer,RISC) 体 系 
结构 经 优化 可 以 达到 较 短 的 时 钟 周 期 ,每 个 指令 所 需 周 期 较 少 ,并 有 有 效 的 指令 流 流水 操作 。 
”如 图 2-24 所 示 , RISC 处 理 器 的 数据 通路 通常 由 一 个 大 的 寄存 器 文件 和 一 个 ALU 组 成 。 一 个 
大 的 寄存 器 文件 是 十 分 必要 的 ,因为 它 包 含 了 程序 计算 中 所 有 的 操作 数 和 结果 。 通 过 load 指 
令 将 数据 放 到 寄存 器 文件 ,通过 store 指令 将 其 放 回 内 存 。 这 个 寄存 器 文件 越 大 ,代码 中 load 
和 store 指令 的 数目 就 越 少 。 当 RISC 执行 一 条 指令 时 ,指令 管道 首先 将 指令 放 到 指令 寄存 器 
中 。 然 后 将 该 指令 解码 并 从 寄存 器 文件 中 读 取 合适 的 操作 数 。 第 三 步 ,RISC 做 下 面 两 件 事情 
之 一 :或 者 在 ALU 中 执行 所 需 的 操作 ,或 者 从 数据 缓存 里 面 读 / 写 数 据 。 应 注意 每 个 指令 的 
执行 仅仅 占用 大 约 三 个 时 钟 周 期 ,这 就 意味 着 指令 流水 线 可 以 很 短小 且 高 效 ,而 仪 在 数据 或 者 
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分 文 相 关 性 的 情况 下 才 会 使 用 较 多 周期 。 
我 们 同时 注意 到 ,因为 所 有 的 操作 数 都 
包含 在 寄存 带 文 件 里 面 ,而 且 只 使 用 了 几 种 
简单 的 寻 址 方式 ,所 以 同样 可 以 简化 数据 通 
路 的 设计 。 此 外 ,因为 每 个 操作 要 执行 一 个 
时 钟 周期 而 每 个 指令 要 执行 三 个 时 钟 周 期 ， 
因此 控制 单元 也 可 以 很 简单 ,而 且 可 以 使 用 
随机 逻辑 而 不 是 微 程 序 控制 来 实现 。 总 之 ， 
RISC 中 控制 和 数据 通路 的 简化 导致 了 简短 
的 时 钟 周期 ,并 最 终 达 到 了 更 高 的 性 能 。 
然而 ,应 该 指出 的 是 , RISC 体系 结构 的 
极 大 简化 则 要 求 一 个 更 为 复杂 的 编译 髓 。 
比如 说 , RISC 设计 不 会 在 指令 相关 性 发 生 
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图 2-24 ”硬件 控制 的 RISC 


时 就 停止 指令 流水 线 , 这 就 意味 着 编译 器 有 责任 产生 出 无 相关 性 的 代码 ,或 者 可 以 通过 时 延 指 
令 的 产生 ,或 者 对 指令 进行 重新 排序 。 而 且 由 于 指令 数目 的 减少 这 一 事实 ,RISC 编译 器 将 会 


需要 一 系列 的 RISC 指令 来 完成 复杂 的 操作 。 


当然 ,虽然 这 些 特 点 需要 更 为 复杂 的 编译 秀 , 但 


是 它们 同时 也 给 予 编译 器 极 大 的 灵活 性 来 实现 积极 的 优化 。 

最 后 ,我 们 应 该 注意 到 由 于 未 采用 复杂 指令 ,RISC 程序 往往 需要 多 出 20% 到 30% 的 程序 
内 存 。 然 而 ,因为 较为 精简 的 指令 集 可 以 使 得 编译 右 设 计 和 运行 时 间 更 为 简短 ,所 以 最 终 的 编 
译 后 的 代码 效率 是 很 高 的 。 此 外 ,由 于 这 些 较 为 简单 的 指令 集 ,RISC 处 理 器 往往 比 那些 CISC 


处 理 硕 太 省 奎 片 面积 ,并 缩短 了 设计 周期 。 
2.10.3 ”向量 机 


向 量 机 (vector machine) 发 展 于 20 世纪 70 年 代 早 期 ,是 为 了 满足 不 断 增 长 的 对 于 高 性 能 


计算 的 需求 ,这 需要 减少 时 钟 到 最 小 值 才 可 以 
达到 。 因 为 时 钟 周期 大 约 是 内 存 访 问 或 算术 
运算 所 需 时 间 的 十 分 之 一 ,所 以 设计 者 们 过 去 
常常 用 许多 的 流水 步 来 实现 内 存 和 算术 单元 。 
在 这 样 的 一 个 向 量 机 中 ,内 存 由 许多 并 行 模 块 
组 成 ,而 所 有 模块 中 的 数据 都 根据 同一 地 址 并 
发 存 取 。 简 而 言 之 ,数据 的 一 个 向量 是 并 发 存 
取 的 。 每 个 向 量 都 从 向 量 寄 存 器 中 通过 内 存 
存 取 流 水 线 ( 内 看 管道 ) 串 行 移 人 或 移出 。 每 
个 向 量 指令 都 对 两 个 向 量 操作 数 操作 ,并 且 生 
成 一 个 向 量 结果 。 正 如 图 2-25 所 示 , 回 量 机 
同时 也 包括 标量 寄存 器 以 及 执行 标量 运算 的 
标量 功能 单元 。 

向 量 机 的 主要 优点 是 只 要 代码 中 有 足够 
的 向 量 操作 , 则 其 速度 就 非常 快 。 然 而 我 们 必 








图 2-25 mH 
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须 注意 到 ,普通 的 代码 并 不 是 特意 为 了 向 量 机 所 编写 的 ,这 就 意味 着 向 量 机 需要 一 个 向 量化 编 
详 天 来 做 化 普通 代码 以 适合 向 量 指令 。 通 常 来 说 ,这 样 的 向 量化 的 工作 是 通过 将 一 个 循环 体 
分 解 成 尽 可 能 多 的 问 量 操作 ,而 其 中 每 一 个 向 量 操作 都 可 以 看 做 只 含有 单一 操作 的 循环 体 。 
此 外 ,我 们 也 应 该 看 到 在 处 理 标量 操作 和 有 着 非 线性 标 引 的 数组 存 取 时 ,向量 机 的 性 能 往往 会 
有 所 下 降 。 


2.10.4 超 长 指令 字 计算 机 

超 长 指令 字 计 算 机 (very-long-instruction-word computer,VLIW) 通 过 在 数据 通路 中 使 用 
多 个 功能 单元 来 体现 并 发 性 ,并 且 所 有 的 功能 单元 都 在 一 个 中 心 控制 下 按照 一 个 锁 步 又 的 机 
制 来 执行 。 一 个 VLIW 指令 对 于 每 个 功能 单元 都 有 一 个 对 应 的 域 , 并 且 VLIW 指令 中 的 每 个 
域 都 标明 了 源 和 目的 操作 数 的 地 址 以 及 该 功能 单元 要 执行 的 操作 。 因 此 ,一 个 VLIW 指令 通 
常 很 长 ,因为 它 的 每 个 功能 单元 都 几乎 包含 了 一 条 标准 的 指令 。 

在 图 2-26 中 ,我 们 可 以 看 到 一 个 VLIW 数据 通 
路 的 实例 , 它 由 四 个 功能 单元 组 成 :两 个 ALU Al 
个 乘法 器 ,一 个 寄存 器 文件 和 一 个 存储 器 。 为 了 利 
用 所 有 这 四 个 功能 单元 ,这 个 例子 中 寄存 器 文件 有 
16 个 端口 :8 个 输出 端口 ,用 于 为 功能 单元 提供 操作 
数 ;4 个 输入 端口 ,用 于 存储 从 功能 单元 得 到 的 结果 ; 
还 有 4 个 输入 /输出 端口 ,用 于 存储 器 间 的 通信 。 现 
在 有 一 个 很 有 趣 的 现象 值得 注意 :假设 在 VLIW 上 
执行 的 代码 有 四 个 并 行路 径 ,这 就 使 得 VLIW 在 每 
个 时 钟 周 期 内 可 以 执行 四 个 独立 的 指令 ,我 们 可 能 
想像 图 2-26 中 的 VLIW 所 提供 的 性 能 应 该 是 只 含有 单一 功能 单元 的 处 理 髓 的 4 倍 。 但 是 在 
实际 中 ,大 部 分 的 代码 都 存在 并 行 部 分 和 串 行 代码 相互 交叉 的 情况 。 因 此 , 带 有 大 量 功 能 单元 
的 VLIW 很 有 可 能 不 会 被 完全 利用 。 我 们 仍然 需要 假定 理想 的 条 件 是 所 有 的 操作 数 都 存放 
在 寄存 器 文件 中 ,而 每 个 时 钟 周期 要 从 中 取出 8 个 操作 数 并 存 人 4 个 结果 ,此 外 还 要 从 存储 器 
中 取出 4 个 新 的 操作 数 来 作为 下 个 时 钟 周 期 之 用 。 但 是 应 该 注意 到 ,因为 某 些 结果 必须 存 回 
给 存储 器 以 及 某 些 结果 在 下 个 时 钟 周期 中 并 不 需要 ,因此 这 一 计算 模式 并 不 容易 达到 。 在 这 
些 条 件 之 下 ,VLIW 数据 通路 的 效率 就 没有 理想 状态 下 那么 高 。 

最 后 ,我 们 应 该 指出 存在 着 两 个 技术 局 限 性 ,影响 VLIW 体系 结构 的 实现 。 第 一 , HRT 
构建 了 一 个 8 到 16 个 端口 的 寄存 器 文件 时 ,那么 一 旦 我 们 超出 了 这 个 数目 限制 时 ,这 些 寄存 
器 文件 的 效率 和 性 能 往往 会 快速 下 降 。 第 二 ,因为 VLIW 的 程序 和 数据 存储 器 都 需要 较 高 的 
通信 带宽 ,因此 这 些 系统 往往 也 要 求 昂 贵 的 高 端 打包 技术 。 总 之 ,这 就 是 为 什么 VLIW 体系 
结构 不 如 RISC 体系 结构 受 欢 迎 的 原因 。 





2-26 VLIW 数据 通路 举例 


2.11 并 行 处 理 器 


在 并 行 处 理 器 的 设计 之 中 ,我 们 可 以 通过 使 用 并 行 工 作 的 多 个 处 理 单元 (PE) 来 利用 它们 
的 空间 并 行 性 。 在 这 种 类 型 的 体系 结构 中 ,每 个 处 理 单元 可 能 包括 自己 的 带 有 寄存 姻 和 本 地 
存储 器 的 数据 通路 。 并 行 处 理 的 两 种 典型 的 类 型 分 别 是 SIMD 处 理 器 ( 单 指令 流 多 数据 流 ) 和 
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MIMD 处 理 器 (多 指令 流 多 数据 流 )。 | 

在 SIMD 处 理 器 (通常 叫做 阵列 处 理 器 ) 中 ,所 有 的 处 理 单元 按照 一 个 锁 步 的 机 制 来 执行 
同一 条 指令 。 为 了 将 这 条 指令 传播 到 所 有 处 理 单元 以 及 控制 它们 的 执行 ,我 们 通常 使 用 一 个 
单一 的 全 局 控制 器 。 通 常情 况 下 ,阵列 处 理 器 都 是 绑 定 在 一 个 主 处 理 器 上 ,这 就 意味 者 它 可 以 
被 看 成 是 一 种 对 于 需要 集中 计算 的 任务 的 硬件 加 速 器 。 这 种 情况 下 , 主 处 理 顺 会 把 数据 加 载 
到 各 个 处 理 单元 中 ,而 后 当 计 算 完 成 后 再 统计 结果 。 而 且 如 果 需 要 ,处 理 单 元 还 可 以 直接 和 它 
们 最 近 的 邻居 进行 通信 。 

阵列 处 理 器 的 最 大 的 优点 就 是 非常 适合 于 那些 可 以 自然 映射 到 矩形 网 格 上 的 计算 ,比如 
图 像 处 理 操作 , 因为 一 个 图 像 可 以 分 解 成 矩形 网 格 里 面 的 像素 点 ;再 比如 天 气 预报 ,因为 地 球 
的 表面 可 以 分 成 xX n 英里 2 的 方 格 。 因 为 所 有 的 处 理 单元 都 执行 相同 的 指令 流 , 所 以 在 扼 
形 阵列 处 理 器 中 的 网 格 点 上 编写 程序 变 得 很 简单 。 然 而 ,对 于 将 要 在 阵列 中 的 数据 路 由 选择 
进行 程序 设计 就 变 得 很 困难 ,因为 要 求 程序 员 不 得 不 对 每 个 时 钟 周期 中 每 个 数据 的 所 有 位 置 
都 了 如 指 掌 。 基 于 这 个 原因 , 像 人 第 阵 的 三 角 化 或 是 转 置 操作 这 些 问 题 在 一 个 阵列 处 理 兹 上 很 
难 编程 进行 处 理 。 

只 有 当 问 题 的 自然 结构 和 阵列 处 理 器 的 拓扑 结构 很 匹配 时 ,阵列 处 理 占 才 是 易于 构建 并 
且 是 易于 编程 的 。 因 此 ,由 于 用 户 很 难 对 普通 的 问题 类 型 编写 程序 ,所 以 不 应 该 把 它们 当 作 通 
用 计算 机 。 

MIMD 处 理 锋 ,通常 叫做 多 处 理 器 系统 (mul- 
tiprocessor system), 它 和 SIMD 的 不 同 之 处 在 于 
它 的 每 个 处 理 单元 都 执行 自己 的 指令 流 。 在 这 种 
类 型 的 体系 结构 中 ,问题 既 可 以 由 主 处 理 和 项 进行 
加 载 ,也 可 以 由 每 个 处 理 器 从 共享 内 存 中 加 载 目 
己 的 问题 。 通 过 采用 图 2-27 中 所 示 的 一 种 或 者 
两 种 通信 机 制 ,每 个 处 理 器 可 以 和 这 个 多 处 理 需 
系统 中 的 其 他 任何 处 理 器 进行 通信 。 在 共享 内 存 
多 处 理 器 系统 (shared-memory multiprocessor) 中 ， 
所 有 的 处 理 器 都 通过 N 端口 x N 端口 的 互联 网 
络 连接 到 一 个 共享 内 存 上 ,这 就 意味 着 每 个 处 理 
器 都 可 以 对 共享 内 存 中 的 任意 数据 进行 存 取 。 而 
另 一 方面 ,在 消息 传递 多 处 理 器 系统 (message- 
passing multiprocessor) 中 ,每 个 处 理 器 都 往往 拥有 
自己 的 一 块 大 的 本 地 内 存 ,并 且 以 消息 包 的 形式 图 2-27 多 处 理 器 通信 机 制 
通过 互联 网 络 向 其 他 处 理 器 发 送 数 据 。 共 享 内 存 
使 用 的 互联 网 络 必须 要 求 速度 快 ,因为 它 常常 用 于 小 规模 数据 的 通信 ,比如 一 个 单字 。 相 及 
地 ,消息 传递 使 用 的 互联 网 络 往往 速度 要 慢 一 些 , 因 为 它 的 使 用 频率 不 高 而 且 用 于 通信 和 包括 许 
多 个 数据 字 的 大 消息 。 由 于 速度 要 求 的 不 同 , 设 计 一 个 共享 内 存 使 用 的 互联 网 络 要 比 设计 一 
个 消息 传递 使 用 的 互联 网 络 要 困难 。 最 后 ,应 该 注意 到 多 处 理 器 系统 更 加 易于 编程 ,因为 它们 





b) 消息 传递 
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不 是 面向 指令 的 ,而 是 面向 任务 的 。 每 个 任务 都 独立 执行 ,而 且 如 果 有 必要 ,在 任务 完成 之 后 
可 以 进行 同步 化 。 因 此 ,多 处 理 右 使 得 程序 的 编号 .数据 的 划分 .代码 的 并 行 化 和 编译 工作 都 
要 比 阵列 处 理 紫 更 为 简单 。 


2.12 结论 


本 章 讨 论 了 用 于 表示 系统 的 不 同 种 类 的 模型 以 及 用 于 实现 系统 的 不 同 种 类 的 体系 结构 。 
不 论 是 模型 还 是 体系 结构 对 于 设计 过 程 都 是 至 关 重 要 的 ,因为 这 一 过 程 的 整体 目标 就 是 通过 
体系 结构 中 提供 的 一 组 物理 构件 来 实现 模型 中 表示 的 所 要 求 的 系统 功能 。 更 为 重要 的 是 ,本 
章 还 阐明 不 同 模型 强调 系统 的 不 同方 面 一 一 其 状态 .活动 .数据 或 是 控制 。 有 了 这 个 可 选择 的 
关注 点 ,设计 者 选择 一 个 模型 适 于 表示 所 设计 的 系统 的 最 为 重要 的 特点 ,是 至 关 重要 的 。 而 
且 , 因 为 评测 一 个 好 的 语言 是 根据 它 直 接 表示 所 求 模 型 的 程度 ,所 以 设计 者 选择 适合 于 这 一 模 
型 的 语言 也 是 同等 重要 的 。 然 而 有 趣 的 是 ,系统 描述 最 常用 的 语言 通常 并 不 能 直接 描述 给 定 
系统 的 最 好 的 模型 。 解 决 这 - -问题 将 是 以 下 三 章 的 话题 ,我 们 到 时 将 会 考虑 其 中 的 原因 结果 
以 及 解决 方法 。 | 60 | 


2.13 练习 


1. 我 们 可 以 使 用 不 同 模型 将 一 个 系统 概念 化 ,比如 说 状态 机 A .算法 等 。 讨 论 对 于 下 列 
系统 最 适合 的 概念 模型 : 
(a) 一 个 模 10 HR SE 
(b) 电话 应 答 机 ; 
(c) 一 个 寻找 一 组 数字 的 中 值 的 算法 ; 
(d) 温度 控制 部 ; 
(e) 存 取 内 存 的 通信 协议 ; 
(£) 存 取 微 处 理 器 的 通信 协议 。 
. 层次 化 的 FSM 相对 于 过 去 平面 的 FSM 的 优点 是 什么 ? 
. 面向 对 象 模型 与 面向 数据 .面向 活动 模型 的 区 别 是 什么 ? 
. 列 出 流程 图 与 结构 图 的 所 有 不 同 之 处 。 并 用 流程 图 来 表示 图 2-16 给 出 的 结构 图 。 
. 列 出 RISC 和 CISC 体系 结构 的 优 缺 点 。 
. 定义 实现 各 个 概念 模型 的 最 有 效 的 体系 结构 。 
. 详细 说 明 作 为 扩展 FSMD 体系 结构 的 子 集 的 各 个 体系 结构 。 
. 说 出 通用 和 专用 体系 结构 的 不 同 之 处 。 
. 操作 流水 线 .数据 通路 流水 线 .指令 流水 线 和 控制 流水 线 的 区 别 是 什么 ? 
10. 列 出 各 个 体系 结构 的 度量 的 技术 缺陷 。 
11. 在 设计 和 实现 互联 网 络 时 的 必要 事项 是 什么 ? 
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在 前 面 的 章节 中 ， 我 们 已 经 7 了解 了 如 何 用 不 同 的 概念 模型 来 理解 、 组 织 和 定义 一 个 系统 
的 功能 性 。 然 而 ， 模 型 仅仅 是 理论 上 的 概念 ， 我 们 需要 使 用 系统 描述 语 育 ， 以 一 种 具体 的 形 
式 来 捕获 这 些 模型 。 本 章 将 阐明 不 同 模型 之 间 的 一 些 共 同 特性 ， 并 考虑 如 何 利 用 更 为 一 般 化 
的 描述 语言 来 捕获 这 些 特性 。 此 外 ， 我 们 还 将 特别 关注 那些 适合 于 散人 入 式 系统 设计 的 模型 和 


语言 。 
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一 个 系统 可 以 在 任何 一 个 不 同 的 抽象 级 别 进行 描述 ,而 每 一 级 别 都 有 其 不 同 目的 。 例 如 ， 
TRHA (logic level) 描 述 的 系统 中 ,设计 者 可 利用 原理 图 输入 工具 捕获 系统 的 结构 。 作 为 为 
一 种 选择 ,在 系统 组 件 级 (system-component level) 中 ,设计 者 可 以 不 考 虚 任何 结构 细节 的 描 
述 ,而 使 用 硬件 描述 语言 (hardware description language,HDL) 来 描述 系统 中 每 一 组 件 的 功能 
性 。 这 样 一 个 系统 组 件 的 描述 可 以 代表 定制 的 硬件 、 内 存 或 是 执行 一 定 指令 集 的 处 理 器 。 最 
后 ,在 概念 级 (conceptual level) 的 描述 中 ， 能 够 不 涉及 任何 系统 组 件 而 表述 一 个 完整 的 系统 功 
能 性 。 从 传统 方法 上 来 说 ,我 们 希望 能 使 用 某 种 自然 语言 (如 英语 ), 在 概念 级 描述 一 个 新 产品 
的 功能 性 。 然 而 , 随 着 当今 系统 变 得 越 来 越 复 杂 , 它 们 常常 要 求 采用 一 种 新 的 方法 完成 系统 的 
概念 化 设计 ;更 进一步 地 说 ,设计 者 需要 以 一 种 可 执行 系统 描述 语言 (executable specification 
language) 的 形式 描述 系统 的 概念 。 这 种 可 执行 的 语言 以 机 器 可 读 并 能 模拟 的 方式 捕获 系统 的 
功能 性 。 

这 种 方法 有 以 下 几 个 优点 。 首 先 ,模拟 一 个 可 执行 的 描述 允许 设计 者 验证 系统 预期 功能 
性 的 正确 性 。 在 传统 的 方法 中 ,设计 是 从 自然 语言 描述 开始 的 ,而 验证 只 有 等 到 设计 被 完全 实 
现 为 一 个 可 模拟 的 系统 描述 后 才能 进行 (一 般 来 说 已 经 是 门 级 的 原理 图 )。 其 次 ,系统 描述 能 
作为 综合 工具 的 输入 。 通 过 利用 综合 工具 ,可 得 到 一 个 系统 的 实现 ,这 样 极 大 地 减少 设计 的 周 
期 。 再 次 ,这 样 一 种 描述 可 以 作为 一 个 全 面 的 系统 文档 ,为 设计 者 提供 明确 的 系统 预期 功能 性 
”说 明 。 最 后 ,可 执行 系统 描述 可 作为 一 个 很 好 的 中 间 媒 体 , 利 用 它 可 在 不 同 的 用 户 和 工具 之 间 
完成 设计 信息 的 交换 。 因 为 这 种 方法 强调 的 是 已 定义 好 的 系统 组 件 ,而 这 些 组 件 通常 是 由 不 
同 设计 者 独立 完成 的 ;结果 使 一 些 与 系统 集成 相关 的 问题 最 小 化 。 

在 第 2 章 ,为 了 能 从 概念 上 描述 不 同类 型 的 系统 ,我 们 介绍 了 一 些 常用 的 模型 。 相 对 于 这 
些 概念 模型 ,很 显然 任何 一 种 描述 语言 的 目 标 都 是 希望 设计 者 可 以 通过 最 小 的 努力 获取 系统 
的 概念 。 例 如 , 当 我 们 想 要 定义 软件 中 面向 对 象 的 概念 模型 时 ,C++ 程序 设计 语言 可 能 是 最 
为 行 之 有 效 的 语言 。 但 是 ,如 果 我 们 的 目标 是 描述 一 个 层次 化 /并 发 性 的 有 限 状 态 机 模型 时 ， 
Statecharts 语言 则 可 能 是 更 为 实用 的 选择 [Har87] o 

因为 不 同 概念 模型 具有 不 同 的 特性 ,任何 一 种 给 定 的 描述 语言 都 能 或 多 或 少 地 适合 于 茶 
种 模型 ,适合 的 程度 依赖 于 它 是 否 能 支持 这 个 模型 中 所 有 的 或 部 分 的 特性 。 为 了 找到 某 种 能 
直接 捕获 给 定 的 概念 模型 的 语言 ,我 们 需要 在 概念 模型 和 语言 结构 的 特性 中 ,建立 一 对 一 的 相 
关 性 。 
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在 本 章 ,我 们 将 从 描述 概念 设计 模型 中 的 一 些 共有 特性 开始 。 然 后 ,介绍 一 种 特殊 类 型 系 
iF, BDA A A (embedded system) 中 的 特性 。 其 中 ,我 们 将 分 析 一 些 普遍 使 用 的 硬件 描述 
语言 ,比如 VHDL、Verilog、HardwareC、 通 信 顺 序 进程 (communicating sequential process, CSP) ù 
Statecharts、 规 范 与 描述 语言 (specification and description language, SDL). Silage 以 及 Esterel 
等 ,并 着 重 讨 论 这 些 语言 如 何 支持 散人 入 式 系 统 的 特性 。 最 后 ,我们 将 介绍 SpecCharts 语言 , 它 
是 一 种 基于 程序 状态 机 模型 (在 第 2 章 已 做 过 介绍 ) 的 语言 ;同时 还 将 展示 这 种 语言 如 何 文 持 
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3.2 概念 模型 的 特性 


在 本 节 中 ,我 们 将 给 出 概念 模型 中 通常 被 设计 者 使 用 的 一 些 共 有 特性 。 为 了 表述 这 些 特 
性 ,我 们 的 目标 是 评价 每 一 个 特性 在 描述 一 种 或 多 种 系统 行为 概念 方面 是 如 何 使 用 的 。 


3.2.1 并 发 性 

任何 一 个 系统 都 可 被 分 解 成 一 些 功能 块 ,我 们 称 之 为 行为 (behavior)。 而 每 一 个 这 样 的 行 
为 都 可 以 几 种 方式 来 表示 ,例如 一 个 进程 、 一 个 过 程 或 是 一 个 状态 机 。 在 多 数 的 情况 下 ,一 个 
系统 的 功能 性 最 容易 被 表示 成 一 些 并 发 行为 的 集合 ,因为 只 简单 地 使 用 顺序 结构 来 定义 系统 
功能 性 可 能 会 导致 一 个 难于 理解 并 十 分 复杂 的 描述 。 然 而 ,如 果 我 们 能 找到 一 种 可 表示 并 发 
性 的 方式 ,那么 对 于 这 样 的 系统 ,我 们 通常 能 得 到 一 个 更 为 自然 的 描述 。 例 如 ,考虑 一 个 仅 有 
两 个 并 发 行为 的 系统 ,它们 通过 有 限 状 态 机 F, 和 Fy 分 别 描述 。 系 统 的 一 个 顺序 表示 将 可 能 
是 两 个 有 限 状态 机 叉 积 的 结果 , 即 Fj x F,, 势 必 产 生 一 个 巨大 数目 的 状态 集 。 而 一 个 更 为 优 
雅 的 方法 是 ,使 用 由 两 个 或 更 多 并 发 有 限 状态 机 组 成 的 概念 性 模型 来 定义 其 系统 的 行为 ,类 似 
于 Statecharts[ Har87] 模 型 和 PSMLGVN93] 模 型 。 

并 发 性 的 概念 可 应 用 到 任何 一 个 不 同 的 抽象 级 别 中 [HB8Sj。 例 如 ,在 作业 级 (job-level) 
并 发 中 ,其 并 发 性 可 以 表示 为 利用 多 重 编程 (multiprogramming) 、 多重 处 理 (multiprocessing) 和 
时 间 共 享 (time sharing) OL] ,来 实现 几 个 作业 间 的 并 行 执行 。 相 对 而 言 ,在 任务 级 (task-level) 
中 ,并 发 则 是 指 组 成 一 个 作业 的 不 同 任务 同时 执行 。 许 多 系统 都 是 在 这 一 级 别 中 描述 ,系统 中 
的 每 个 任务 通过 行为 来 表示 。 语句 级 (statement-level) 的 并 发 指 的 是 在 一 个 任务 中 不 同 语句 
间 的 并 行 执行 。 语 句 级 并 发 的 一 个 实例 可 以 是 在 向 量 处 理 器 上 一 个 循环 体内 语句 的 执行 。 除 
此 之 外 ,还 有 操作 级 (operation-level) 的 并 发 , 它 指定 一 个 系统 中 不 同 操作 的 并 发 执行 。 例 如 ， 
一 个 加 法 操作 可 以 和 一 个 乘法 操作 并 发 执行 。 操 作 级 的 并 发 通常 在 处 理 器 .过 滤器 以 及 数字 
信号 处 理 器 中 都 能 找到 。 最 后 ,并 发 也 存在 于 位 级 (bit-level) 粒 度 中 ,比如 在 一 个 算术 人 逻辑 运 
算 髓 中 逐 位 计算 的 情况 。 

并 发 性 的 表示 可 分 为 两 大 类 ,数据 驱动 (data-driven) 或 控制 驱动 (control-driven)。 这 依赖 
于 在 行为 中 动作 的 执行 顺序 。 

1. 数据 驱动 的 并 发 性 

一 些 行为 可 被 显 式 地 描述 为 操作 或 语句 的 集合 ,而 没有 指定 其 显 式 的 执行 次 序 。 在 这 种 
情况 下 ,执行 的 次 序 可 以 仅 由 它们 之 间 的 数据 依赖 性 决定 。 换 名 话说 ,每 一 个 操作 将 针对 于 其 
输入 的 数据 执行 计算 ,然后 输出 新 的 数据 ;而 这 些 数据 接着 又 被 作为 其 他 操作 的 输入 。 在 这 样 
的 数据 流 描述 中 ,操作 的 执行 仅 依赖 于 数据 的 可 用 性 ， 而 并 不 依赖 于 操作 或 语句 在 系统 描述 中 





系统 楼 述 语 言 37 


的 物理 位 置 (physical location)。 数 据 流 表 示 以 单一 赋值 规则 (single assignment rule) 为 特性 ， 
这 意味 着 每 一 个 变量 只 能 在 赋值 语句 的 左边 出 现 一 次 。 

例如 ,考虑 如 图 3-1a 中 所 示 的 赋值 语句 。 
和 其 他 数据 驱动 的 执行 不 一 样 , 该 数据 流 中 
对 p 的 赋值 却 在 使 用 p 值 计算 y 值 的 语句 之 Cm > CeO 
后 ,这 种 情况 是 不 会 产生 任何 结果 的 。 不 管 : 





语句 的 执行 次 序 , 这些 操作 的 执行 仅 由 数据 | 采 

的 可 用 性 决定 ,如 图 3-1b 所 示 的 数据 流 图 。 at 
通过 遵循 这 个 规则 ,我 们 可 看 到 ,因为 <、2、 

c 过 是 原始 的 数据 输入 ,所 以 诸 句 1 和 语句 3 4 P y 

中 的 加 法 和 减法 操作 首先 被 执行 。 接 着 ,这 9 整 据 流 语句 D) 操作 执行 的 数据 流 图 
两 个 计算 的 结果 将 会 作为 语句 3 中 乘法 所 需 3-1 数据 驱动 的 并 发 性 

的 数据 。 最 后 ,在 语句 2 中 的 加 法 被 执行 , 计 

By 值 。 


数字 信和 号 处 理 系统 是 一 个 可 以 说 明 数 据 驱 动 并 发 性 的 例子 , 它 对 连续 的 数据 采样 流 进行 
操作 。 然 而 ,应 当 注 意 的 是 : 像 这 样 的 系统 可 能 要 求 额外 的 存储 设备 ,以 防 数 据 流 中 一 些 采样 
数据 将 被 后 续 的 计算 使 用 。 

2. 控制 驱动 的 并 发 性 

控制 驱动 并 发 性 中 的 关键 概念 是 控制 线程 (control thread), 它 被 定义 为 系统 中 必须 顺序 
执行 的 操作 集合 。 正 如 前 面 介绍 数据 驱动 并 发 时 所 说 ,操作 之 间 的 依赖 性 决定 其 执行 顺序 。 
相对 而 言 ,在 控制 驱动 的 并 发 中 , 它 是 由 控制 线程 或 多 线程 来 决定 执行 顺序 的 。 换 句 话说 , 控 
制 驱 动 的 并 发 性 的 特点 是 通过 使 用 指定 多 个 控制 线程 的 显 式 结构 ,而 所 有 这 些 线程 都 并 行 执 
行 。 

任务 级 和 语句 级 都 可 指定 控制 驱动 的 
并 发 性 。 在 任务 级 中 ,如 分 又 -结合 结构 | begn 
(fork-join) 和 进程 结构 (process) 通 常 可 以 | fE AQ; BO: CO: join: 
用 来 指定 操作 的 并 发 执行 。 更 为 详细 地 | ond behavior X; 
说 ,fork 语句 创建 一 组 并 发 控制 线程 ; 而 a) 分 又 - 结合 语句 
join 语句 则 等 待 前 面 分 叉 的 各 并 发 控制 ©) 
线程 完成 。 例 如 ,在 图 3-2a 中 fork 语句 ， 
产生 了 .3 个 控制 线程 A、B 和 C, 它 们 都 以 OOC DOO 

R) 





sequential behavior X 





并 发 的 方式 执行 。 与 此 相关 的 join 语句 

必须 等 待 所 有 的 3 个 线程 都 结束 后 ,其 后 

的 R 函数 中 语句 才能 相继 执行 。 在 图 。) 分 又 - 结合 语句 的 控制 线程 d) 进程 语句 的 控制 线程 
3-2b 的 进程 语句 中 ,我 们 知道 进程 语句 是 图 3.2 控制 驱动 的 并 发 性 

如 何 指定 并 发 性 的 。 应 当 注 意 :一 个 fork- 

join 语句 结构 是 从 一 个 控制 线程 开始 ,分 叉 成 几 个 并 发 线程 ,如 图 3-2c 所 示 ; 而 进程 语句 pro- 
cess 则 是 把 行为 表示 成 并 发 线程 的 集合 ,如 图 3-2d 所 示 。 例 如 ,在 图 3-2b 的 进程 语句 process 
中 ,创建 了 3 个 进程 A、B、C ,每 一 个 进程 代表 一 个 不 同 的 控制 线程 。 分 又 -结合 和 进程 这 两 
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种 语句 结构 可 以 相互 藤 套 ,分 义 -结合 语句 结构 还 能 使 用 棋 套 的 进程 语句 来 实现 ,也 可 以 反 过 


来 实现 。 从 这 种 意义 上 来 说 ,这 两 种 方法 是 相互 等 价 的 。 
在 语句 级 中 ,可 用 两 种 方式 之 一 指定 并 发 性 。 在 显 式 指定 的 语句 级 并 发 中 ,利用 特殊 的 结 
构 指 定 几 个 语句 并 行 执 行 。 例 如 ,考虑 HardwareC. KD88 ] 中 的 并 行 复合 语句 (parallel com- 


pound statement): 


上 面 的 语句 指定 对 x Aly 的 赋值 计算 同时 执行 
语句 级 的 并 发 同样 能 以 隐 式 的 方式 指定 。 例 如 ， 在 未 来 的 某 个 时 间 里 安排 更 新 一 些 值 ， 可 
能 会 使 用 隐 式 的 语句 级 并 发 。 如 下 面 例子 中 的 语句 : 


s <= b + cafter 20ns; 
wait for 20ns; 
v:=3; 


这 些 语句 指定 信号 s 的 值 以 及 变量 wv 的 值 都 将 在 20 纳 秒 后 同时 得 到 更 新 。 


3.2.2 状态 迁移 

与 控制 器 .电信 系统 的 运行 模式 相 类 似 ,一 些 系 统 通 常 被 定义 为 具有 不 同 的 行为 模式 或 状 
态 。 例 如 一 个 交通 灯 控 制 器 [DH89] ,在 白天 和 夜晚 的 操作 可 能 会 有 不 同 的 模式 , 既 可 以 是 手 
动 的 又 可 以 是 自动 的 ;也 可 以 根据 交通 灯 自 身 的 状态 来 改变 其 模式 。 

在 具有 不 同 模式 的 系统 中 ,这 些 模式 之 间 的 迁 
移 有 时 是 以 一 种 无 结构 的 方式 发 生 , 这 和 模式 的 线 
性 顺序 (linear sequencing) 相 反 。 这 种 任意 的 迁移 类 
似 于 在 程序 设计 语言 中 使 用 goto 语句 。 如 图 3-3 
所 示 ,描述 了 一 个 在 模式 P.QLR.SAIT ZERE 
迁移 的 系统 ,它们 的 迁移 次 序 仅 仅 是 由 某 种 条 件 决 
定 的 。 假 定 一 个 有 N 个 状态 的 状态 机 ,那么 在 这 些 
状态 之 间 存 在 NN 种 可 能 的 迁移 。 图 3-3 任意 复杂 行为 之 间 的 状态 迁移 

在 类 似 这 样 的 系统 中 ,不同 模式 下 的 迁移 可 通 
过 检测 某 种 事件 或 条 件 的 发 生来 触发 。 例 如 ,在 图 3-3 中 , 当 事 件 u 发 生 后 ,状态 P 将 迁移 到 
状态 Q。 在 一 些 系 统 中 ,每 一 次 迁移 还 可 能 伴随 着 动作 的 发 生 ,而 在 每 一 个 特殊 模式 或 状态 下 
可 能 有 任意 复杂 的 行为 或 计算 。 在 交通 灯 控 制 器 例子 中 ,在 某 一 个 状态 下 可 能 仅 是 红 `、 黄 、 绿 
灯 之 间 的 顺序 转移 ;然而 在 另 一 个 状态 下 , 它 可 能 需 执行 一 个 算法 来 决定 哪 条 路 具有 更 高 的 优 
先 权 。 这 种 算法 可 以 以 白天 的 时 间 段 和 交通 的 密度 为 基础 。 在 传统 的 层次 化 有 限 状 态 机 概念 
模型 中 ,简单 的 赋值 语句 ,如 z= y+1, 可 与 一 个 状态 相关 联 。 在 PSM 模型 [GVN93j] 中 ,任意 
具有 迭代 和 分 支 结构 的 算法 可 和 一 个 状态 相关 联 。 
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3.2.3 层次 化 

对 于 大 型 系统 而 言 ,我 们 遇 到 的 问题 之 一 是 它们 过 于 复杂 ,难以 用 整体 的 方式 来 进行 考 
虑 。 在 这 种 的 情况 下 ,我 们 希望 利用 层次 化 模型 的 优点 。 首 先 ,因为 层次 化 模型 允许 将 一 个 系 
统 定 义 为 一 些 更 小 子 系 统 的 集合 。 这 样 ,系统 建 模 者 可 在 一 段 时 间 内 集中 精力 对 某 一 子 系 统 
进行 建 模 。 系 统 中 这 种 模块 分 解 的 方法 可 简化 系统 概念 上 的 开发 。 而 且 ,我 们 一 旦 进入 了 适 
当 的 概念 阶段 后 ,这 种 层次 化 模型 能 极 大 地 帮助 我 们 理解 系统 的 功能 性 。 最 后 ,一 个 层次 化 模 
型 为 限制 对 象 作用 域 提供 了 一 种 机 制 ,这 些 对 象 可 以 是 所 声明 的 类 型 .变量 和 子 程序 名 称 等 。 
如 果 没 有 层次 化 的 概念 ,可 能 会 使 所 有 的 对 象 全 局 化 ,这 样 难以 将 它们 在 模型 中 的 特殊 用 途 与 
之 相关 联 ,同时 也 使 我 们 难以 在 同一 个 模型 中 不 同 部 分 重用 这 些 命名 。 

有 两 种 不 同类 型 的 层次 化 :结构 的 层次 化 和 行为 的 层次 化 。 它 们 通常 都 能 在 概念 模型 的 
系统 中 找到 。 

1. 结构 层次 化 

结构 层次 化 是 将 系统 的 描述 表示 成 互联 元 件 的 集合 。 每 一 个 元 件 都 有 其 自己 的 内 部 结 
构 , 这 些 结构 又 是 由 一 个 更 低层 次 的 互联 元 件 集合 组 成 ,以 此 类 推 ,可 以 分 解 为 更 小 的 互联 元 
件 。 在 元 件 间 的 互联 表示 连接 元 件 的 线 网 集合 。 这 样 一 种 模型 可 表示 一 个 结构 的 层次 化 ,其 
优点 在 于 它 能 帮助 设计 者 用 一 个 已 存在 的 元 件 集合 来 定义 新 的 元 件 。 

结构 层次 化 可 在 系统 的 不 同 抽象 级 别 中 描述 出 来 。 例 如 ,一 个 系统 可 以 分 解 为 芯片 /模块 
的 集合 ,它们 之 间 通 过 总 线 相 互通 信 。 一 个 芯片 可 以 由 几 个 块 (block) 组 成 ,而 一 个 块 又 可 以 
由 几 个 寄存 器 传输 (RT) 元 件 构 成 ,如 寄存 器 、 算 术 逻 辑 运算 单元 (ALU) 和 多 路 器 等 。 最 后 ,一 
个 寄存 器 传输 元 件 进 一 步 被 分 解 成 门 的 集合 。 此 外 ,我 们 需 注 意 的 是 系统 的 不 同 部 分 能 在 不 
同 的 抽象 级 别 中 描述 ,如 图 3-4 所 示 , 图 中 处 理 器 已 经 被 结构 化 地 分 解 为 由 一 系列 RT 元 件 组 
成 的 数据 通路 和 由 门 集合 表示 的 相关 控制 逻辑 。 





图 3-4 计算 机 系统 中 的 结构 层次 化 


2. 行为 层次 化 

行为 层次 化 的 描述 是 一 个 将 行为 分 解 成 若干 不 同 子 行为 的 过 程 ,这 些 子 行为 可 以 是 顺序 
执行 的 关系 ,也 可 以 是 并 发 的 关系 。 

一 个 行为 的 顺序 分 解 (sequential decomposition ) 可 以 表示 为 一 些 过 程 集合 或 是 一 个 状态 
机 。 在 第 一 种 情况 下 ,行为 的 过 程 顺 序 分 解 (procedural sequential decomposition) 是 把 行为 定义 
为 过 程 调用 序列 。 即 使 是 由 一 个 顺序 语句 集合 组 成 的 行为 ,我 们 也 可 以 看 成 是 把 这 些 语 句 封 
装 在 一 起 的 一 个 过 程 。 图 3-5a 显示 了 行为 P 的 过 程 顺序 分 解 ,行为 P 由 顺序 执行 的 子 行为 
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组 成 ,分 别 用 过 程 Q MR 表示 。 图 中 行为 的 层次 化 可 以 通过 骸 套 的 过 程 调用 描述 。 过 程 中 的 
递归 调用 人 允许 指定 动态 行为 层次 化 ,这 意味 着 层次 化 的 深度 将 在 运行 时 决定 。 


behavior P 
variable x,y; 
gin 


Q(x); 
R(y), 
end behavior P; 





a) 过 程 b) 状态 机 
图 3-5 顺序 行为 分 解 


图 3-5b 给 出 了 行为 P 的 状态 机 顺序 分 解 (state-machine sequential decomposition)。 在 图 
中 ,P 分 解 为 两 个 顺序 子 行为 Q 和 R ,每 一 个 子 行为 表示 状态 机 中 的 一 个 状态 。 通 过 允许 将 
一 个 子 行为 表示 成 男 一 个 状态 机 ,这 种 状态 机 的 表示 方式 可 体现 出 其 层次 化 。 因 此 ,Q AR 
是 状态 机 ,所 以 它们 可 进一步 分 解 成 顺序 子 行为 。 在 最 低层 的 行为 中 ,包括 Q1，…R2, 它 们 
被 称 为 叶子 行为 (leaf behavior). | 

在 一 个 顺序 分 解 的 行为 中 ,通过 几 种 类 型 的 迁移 :简单 迁移 、 成 组 迁移 和 层次 化 迁移 ,表示 
子 行为 之 间 的 关联 。 一 个 简单 迁移 (simple transition) 类 似 于 在 一 个 FSM 模型 中 相互 连接 的 
状态 , 它 能 引起 在 行为 层次 中 同一 级 别 的 两 个 状态 间 的 迁移 。 如 图 3-5b 所 示 ,由 事件 el 触发 
的 迁移 使 控制 权 从 行为 Q1 传递 给 行为 Q2。 成 组 迁移 (group transition) 指 的 是 一 组 状态 的 迁 
移 , 比 如 事件 e5 引发 从 Q 的 任何 子 行为 向 行为 R 迁移 的 情况 发 生 。 层 次 化 迁移 (hierarchical 
transition) 则 是 跨越 了 几 个 行为 层次 级 别 的 迁移 ,同时 它 也 包括 简单 迁移 和 成 组 迁移 。 例 如 ， 
由 标记 为 e6 的 迁移 将 控制 权 从 行为 Q3 传递 给 行为 R1, 这 意味 着 它 必须 跨越 两 个 层次 级 别 。 
同 理 , 标 记 为 e7 的 迁移 将 控制 权 从 Q 传递 给 较 低 层次 的 状态 R2。 

对 于 一 个 顺序 分 解 的 行为 ,必须 显 式 指定 其 初始 的 子 行为 ,这 个 子 行为 应 当 在 该 行为 被 激 
活 的 时 候 执行 。 如 图 3-5b 中 , 当 R 的 父 行为 P 被 激活 时 ,R 是 第 一 个 执行 的 子 行为 ,因为 有 
一 个 用 带 圆 点 箭头 从 父 行为 指向 R。 同 理 , Q1 和 R1 分 别 是 行为 QAR 的 初始 于 行为 。 

行为 的 并 发 分 解 (concurrent decomposition) 可 通过 分 义 - 结合 结构 或 是 利用 进程 集合 建 
模 系 统 的 方式 来 表示 。 这 些 结构 已 经 在 3.2.1 节 中 讨论 。 


3.2.4 程序 结构 


许多 行为 可 很 好 地 描述 成 一 些 顺 序 的 算法 。 例 如 ,考虑 对 一 个 数组 中 存储 的 数字 集合 进 
行 排序 的 系统 ,或 是 一 个 用 来 生成 随机 数 集合 的 系统 。 在 这 样 的 情况 下 ,如 果 系 统 设 计 者 设法 
把 行为 层次 化 分 解 为 越 来 越 小 的 子 行为 ,将 最 终 使 每 个 子 行为 的 功能 性 都 能 用 一 个 算法 直接 

使 用 程序 结构 (programming construct) 指 定 行为 的 优点 在 于 :人 允许 系统 建 模 者 对 系统 中 的 
计算 行为 指定 其 显 式 的 执行 顺序 。 虽 然 可 以 利用 一 些 注释 来 描述 算法 ,但 程序 设计 语言 结构 
仍然 被 相当 广泛 地 使 用 。 这 些 结构 包括 赋值 语句 、 分 支 语句 (if/case 语句 )、 循 环 语句 
(while、for 和 repeat 循环 语句 ) 以 及 子 程序 调用 (function 函数 和 procedure WH). AP, 
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数据 类 型 如 记录 类 型 数组 以 及 链表 通常 对 复杂 的 数据 结构 建 模 都 非常 有 用 。 
图 3.6 显示 了 我 们 将 怎样 使 用 程序 设计 结构 
指明 一 个 以 降序 方式 排序 10 个 整数 集合 的 行为 。 | rable buf, Ber ype (oon 


variable i,j : integer; 


注意 过 程 Swap 交换 它 的 两 个 参数 值 。 fori=1to10 


305 行为 守 forj=ito 10 
.2.5 行为 完成 if (buf() > buf0)) then 
行为 完成 (behavioral completion) 指 的 是 一 种 end wap(buil, butG)), 


表明 自身 行为 已 经 完成 的 能 力 ,同时 也 是 一 种 能 “| ona tor 
使 其 他 行为 检测 到 这 个 完成 状态 的 能 力 。 当 一 个 Lenc 





行为 中 所 有 的 计算 都 已 执行 完毕 ,并 且 所 有 必须 图 3.6 ”使 用 程序 设计 结构 表示 
被 更 新 的 变量 都 已 经 用 新 值 写 人 后 ,这 个 行为 才 的 排序 行为 
能 称 之 为 完成 。 


“在 有 限 状 态 机 模型 中 ,我 们 通常 指定 一 个 显 式 定义 的 状态 集合 为 最 终 状态 (final state). 
这 意味 着 :对 于 一 个 状态 机 而 言 ,完成 将 会 在 控制 流转 移 到 这 些 最 终 状态 之 一 时 发 生 , 如 图 
3-7a 所 示 。 








c) 程序 状态 X 的 单 层 视图 d) 分 解 后 的 顺序 子 行为 
图 3-7 行为 完成 

在 我 们 使 用 程序 设计 语言 结构 时 , 当 程序 中 的 最 后 一 个 语句 已 执行 时 ,我 们 认为 一 个 行为 
将 完成 。 例 如 , 当 控 制 流 转移 到 一 个 return 语句 时 ,或 是 当 过 程 中 的 最 后 一 个 语句 执行 时 , 即 
称 一 个 过 程 已 完成 。 

在 第 2 章 中 引入 的 PSM 模型 ,使 用 一 个 特殊 的 预定 义 的 完成 点 (completion point) 来 指明 
其 行为 的 完成 。 当 控制 转移 到 这 个 完成 点 时 , 称 包 含 该 完成 点 的 程序 状态 已 经 完成 。 在 这 个 
完成 点 上 , 仅 当 源 程序 状态 完成 后 才能 到 达 的 完成 迁移 攻 TOC(transition-on-completion) are 
现在 已 到 达 。 

考虑 图 3-7b 中 的 程序 状态 机 的 例子 。 在 图 中 , 叶 程 序 状态 的 行为 (如 X1) 用 程序 设计 结 
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构 摘 述 , 这 意味 着 它们 的 完成 是 以 最 后 一 条 语句 的 执行 来 规定 的 。 对 于 X, 程 序 状态 机 的 完 


成 点 使 用 实体 方形 表示 。 当 控制 流 从 程序 状态 X2 转移 给 X 时 (例如 , 当 到 达 事 件 e2 所 标识 
的 TI 弧 时 ) ,表示 程序 状态 X 已 完成 。 接 着 ,事件 e5 将 引起 一 个 TOC Mit BARRE Y。 
同 理 , 当 控制 流 经 事件 e4 标识 的 TOC 弧 , 从 程序 状态 Y 迁移 到 B 的 完成 点 ,表明 程序 状态 B 
已 完成 。 

这 种 对 于 行为 完成 的 描述 有 两 个 优点 。 首 先 ,在 层次 化 的 描述 中 ,完成 点 能 帮助 设计 者 定 
义 每 一 个 层次 级 别 ,并 且 能 把 每 一 个 层次 看 成 是 一 个 独立 的 模块 , 免 于 让 设计 者 考虑 不 同 层 之 
间 相 互 迁移 的 影响 。 例 如 ,图 3-7c 展示 了 在 图 3-7b 中 的 程序 状态 X 是 怎样 把 其 自身 隔离 于 
整个 大 系统 之 外 的 。 将 X 的 行为 功能 性 分 解 成 三 个 程序 子 状态 XX1、X2 和 X3, 系统 建 模 者 并 
不 需要 考虑 事件 e5 标识 的 完成 迁移 所 带 来 的 影响 。 从 这 个 观点 来 看 ,设计 者 可 独立 地 开发 
X 的 程序 状态 机 行为 ,并 结合 它 自身 的 完成 点 (由 事件 e2 标识 的 从 X2 完成 的 迁移 )。 指 定 行 
为 完成 的 第 2 个 优点 在 于 它 允 许 将 一 个 行为 自然 地 分 解 为 一 些 子 行为 ,而 这 些 子 行为 之 间 是 
通过 “完成 "迁移 弧 来 决定 顺序 的 。 例 如 ,图 3-7d 显示 了 一 个 对 一 列 数字 进行 排序 的 应 用 ,我 
们 将 之 分 解 成 有 3 个 有 意义 的 子 行为 : ReadList .SortList Ml OutputList. AA TOC WM EWH 
定 这 些 行为 顺序 ,所 以 系统 并 不 要 求 额外 的 事件 来 触发 它们 之 间 的 状态 迁移 。 


3.2.6 通信 
一 些 系统 是 由 几 个 彼此 通信 的 并 发 行为 或 进程 组 成 的 。 通 常 ， 系统 中 不 同 部 分 之 间 的 通 
信 是 以 共享 内 存 (shared memory) 或 消息 传递 (message passing) 的 方式 来 描述 的 。 我 们 下 面 将 
分 别 讨论 这 两 种 通信 方式 。 
1. 共享 内 存 方式 的 通信 模型 
在 共享 内 存 模型 中 ,每 一 个 发 送 进程 都 能 向 一 个 共享 媒体 (shared medium) 写 人 数据 , 比如 说 
全 局 变量 或 端口 ,而 它们 能 被 所 有 的 接收 进程 读 取 访 问 。 如 果 在 相互 通信 的 进程 之 间 需 要 同 
步 机 制 , 则 必须 显 式 指定 。 例 如 ,一 个 发 送 进程 可 以 通过 加 入 一 个 特殊 的 “有 效 ”(valid) 标 志 ， 
表明 共享 内 存 已 经 更 新 为 新 值 , 而 后 更 新 的 新 值 可 被 接收 进程 读 取 。 这 种 共享 内 存 模型 也 含 
有 一 个 广播 机 制 (broadcast mechanism) , 它 能 确保 由 进程 
或 其 环境 所 产生 的 任何 一 个 值 或 事件 都 能 立刻 被 所 有 其 








他 进程 感知 。 进程 P 进程 0 

图 3-8a 表明 进程 P 和 进程 Q 之 间 是 如 何 通过 使 用 | ws begin 
共享 内 存 方式 来 进行 通信 的 。 为 了 把 数据 发 送 到 进程 | ex Sy 
Q ,进程 P 更 新 了 共享 内 存 中 的 数据 ,接着 进程 Q 读 取 新 | end end 
的 数据 。 a) 共享 存储 器 

通常 ,完成 进程 间 通 信 的 共享 媒体 可 分 为 持久 或 非 持 进程 进程 Q 

AWE. HA (persistent) 的 共享 媒体 能 保持 一 个 进程 写 | vegn pegin 
入 的 数据 值 ,直到 被 其 他 进程 重 写 。 例 如 一 个 存储 单元 ，| 0。 ake) 
如 寄存 器 、 锁 存 器 或 是 一 个 内 存 , 其 他 的 进程 可 以 在 任何 | end’ end 
时 候 访 问 这 些 存储 单元 中 所 保存 的 值 。 相 对 而 言 , 非 村 b) 消息 传递 


久 (non-persistent) 的 共享 媒体 中 ,由 于 在 两 次 连续 写 的 间 , vee fe 
- 司 通信 方 
隔 中 不 能 在 媒体 中 保持 写 人 的 数据 ,因此 仅仅 在 其 值 被 一 RBI 
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个 进程 刚 写 入 时 数据 才 可 以 利用 。 非 持久 共享 存储 器 的 例子 如 实现 两 个 进程 间 通 信 的 模块 之 
间 cao o 
. 消息 传递 方式 的 通信 模型 

在 消 息 传 递 模型 中 ,进程 间 数 据 传递 的 细节 都 可 通过 在 一 个 抽象 媒体 上 的 通信 来 代替 , 称 
之 为 通道 (channel) , 它 能 传送 数据 或 消息 (message)。 在 每 一 个 进程 里 ,可 使 用 发 送 一 接收 原 
语 (send-receive primitive) 在 通道 上 传输 数据 。 

考虑 图 3-8b 中 的 例子 , 它 显示 了 进程 P 和 Q 之 间 的 通信 和 是 如 何 通过 使 用 消息 传递 模型 
来 实现 的 。 通 道 C 被 定义 为 用 来 从 进程 P 到 进程 Q 传输 数据 的 中 间 媒 体 。 在 进程 已 中 用 变 
Bo 表示 的 数据 值 ,通过 使 用 “发 送 ” 原 语 被 传输 到 通道 上 。 最 后 ,通过 “接收 " 原 语 将 数据 写 人 
”到 进程 Q 中 的 变量 y。 

omnes 因此 它 可 让 设计 者 免 于 考虑 任何 与 实现 相关 的 
细节 。 仅 在 综合 之 后 ,一 个 通道 才 得 以 实现 , 它 由 线 网 集合 组 成 的 总 线 来 代替 ,同时 在 那些 线 
网 上 给 定 了 一 各 项 序 侯 所 传输 的 协议 

在 消息 传递 模型 中 有 以 下 几 种 不 同 的 方式 。 首 先 ,在 “发 送 " 原 语 中 显 式 指明 目标 进程 的 
标识 ,或 者 将 目标 进程 的 标识 隐 式 地 保留 在 通道 的 互联 描述 中 。 其 次 ,一 个 通信 通道 或 者 是 单 
向 的 (uni-directional) 或 者 是 双向 的 (bi-directional) ,这 依赖 于 数据 是 否 能 以 单 向 或 双 回 发 送 。 
最 后 ,一 个 通道 可 以 是 点 对 点 的 (point-to-point) 通 道 , 它 仅 连 接 两 个 进程 ;或 者 是 一 个 多 
路 (multiway) 通道 , 它 能 实现 多 于 两 个 进程 间 的 通信 。 在 一 些 情况 下 ,多 路 通道 可 以 要 求 每 
一 个 进程 被 赋予 一 个 唯一 的 地 址 , 它 可 指定 对 于 任何 数据 传输 的 发 送 / 接 收 进程 。 

消息 传递 通信 中 一 个 更 进一步 的 差别 在 于 它 的 两 种 模式 ;阻塞 模式 (blocking) 或 是 非 阻塞 
模式 (non-blocking)。 如 果 一 个 进程 必须 挂 起 或 阻塞 自身 在 通道 上 的 通信 ,直到 其 他 进程 对 和 
的 数据 传输 做 好 准备 ,我 们 称 这 样 的 消息 传递 通信 是 阻塞 模式 。 阻 塞 模式 下 的 通信 能 有 效 地 
促使 两 个 进程 在 数据 传输 初始 化 之 前 ,彼此 同步 。 阻 塞 模式 通信 的 另 一 个 优点 在 于 它 并 不 要 
求 额外 的 存储 单元 来 实现 通信 。 然 而 ,因为 一 个 进程 必须 始终 挂 起 直到 其 他 进程 准备 好 通信 ， 
这 样 阻塞 模式 下 的 通信 将 可 能 产生 性 能 上 的 恶化 。 非 阻塞 模式 的 通信 并 不 存在 这 个 问题 , 因 
为 进程 不 需要 彼此 同步 传输 数据 。 然 而 ,在 这 种 情况 下 ,额外 的 存储 单元 必须 隐 式 地 和 通道 相 
结合 ,通常 来 说 ,是 以 队列 (queue) 方 式 作 为 存储 单元 。 发 送 进程 通过 通道 将 要 传输 的 数据 瑟 
和 队列 中 ,接着 它 可 以 继续 正常 的 执行 ,而 不 管 接 收 进程 是 否 准备 好 从 队列 中 接收 数据 。 因 为 
两 个 进程 相互 独立 执行 , 仅 通 过 队列 交换 数据 ,因此 在 非 阻 塞 模式 下 的 通信 通常 会 导致 一 个 较 
好 的 性 能 。 然 而 ,速度 上 的 优势 却 是 以 实现 队列 所 需 的 额外 存储 的 代价 来 实现 的 。 此 外 ,如果 
队列 长 度 不 够 ,进程 仍然 可 能 在 某 些 点 上 被 阻塞 传输 数据 。 例 如 , 当 发 送 进程 以 一 个 更 快 的 速 
率 向 队列 发 送 数据 ,而 接收 进程 却 以 相对 较 慢 的 速率 从 队列 获取 数据 时 ,最 终 将 引起 队列 被 数 
据 填 满 ,而 阻塞 发 送 进 程 。 


3.2.7 同步 

在 一 个 由 几 个 并 发 进程 组 成 的 系统 中 ,进程 很 少 是 完全 相互 独立 的 。 每 一 个 进程 都 可 以 
后 成 一 些 被 其 他 进程 使 用 的 数据 和 事件 。 在 这 种 情况 下 , 当 进 程 在 交换 数据 时 或 某 种 动作 必 
须 被 不 同 的 进程 同时 执行 时 ,我 们 需要 同步 化 (synchronize) 这 些 进程 ,一 个 进程 被 挂 起 只 有 等 
到 其 他 进程 执行 到 某 个 点 时 才能 继续 执行 。 一 般 同步 的 方法 可 以 分 成 两 类 ， 即 与 控制 相关 的 
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[80] 同步 机 制 和 与 数据 相关 的 同步 机 制 。 

1. 控制 相关 的 同步 | 

在 控制 相关 的 同步 技术 中 ,利用 行为 的 控制 结构 完成 系统 中 两 个 进程 的 同步 。 例 如 ,在 
3.2.3 节 中 介绍 的 分 又 一 结合 语句 结构 (fork-join) 是 控制 结构 的 实例 。 图 3-9a 中 显示 了 行为 
X 将 分 义 成 fork 三 个 并 发 的 子 进 程 A、B 和 C。 在 图 3-9b 中 ,我们 可 看 出 对 于 行为 和 ,这 些 
不 同 的 执行 流 是 如 何 通过 join 语句 来 进行 同步 的 。 它 确保 了 被 fork 语句 派生 的 三 个 进程 在 
进程 R 执行 之 前 全 部 完成 。 控 制 相关 同步 的 男 一 个 例子 是 使 用 初始 化 (initialization) 技 术 。 
类 似 于 许多 硬件 描述 语言 (HDL) 一 样 ,进程 在 系统 首次 初始 化 时 ,在 初始 状态 下 得 到 同步 ;或 
者 在 进程 的 执行 阶段 时 同步 化 。 在 图 3-9c 的 状态 图 中 ,可 以 看 到 重新 进入 ABC 边界 的 迁移 
a AT SEHR A SEF e 是 设计 为 将 所 有 互 不 相关 状态 A、B 和 C 都 同步 为 它们 的 默认 子 状态 。 同 
理 ,在 图 3-9d 中 ,事件 e 使 B 初始 化 为 其 默认 子 状态 B1( 因 为 AB 已 经 退出 ,然后 重新 进入 )， 
同时 从 A 中 的 子 状态 A1 迁移 到 A2。 


behavior X 


(Q) 
begin 
fork AQ; BO; CQ; join: ?99 
RQ): eS 
Q 


end behavior X; 





a) 分 叉 - 结合 结构 的 行为 XY b) 通过 结合 join 语句 同步 的 执行 流 





c) 通过 初始 化 的 同步 d) 通过 初始 化 的 同步 
图 3-9 Statecharts 中 控制 同步 


2. 数据 相关 的 同步 | 

除了 控制 相关 同步 的 这 些 技术 之 外 ,进程 也 能 通过 以 下 两 种 方法 来 完成 它们 之 间 的 通信 : 
共享 内 存 或 是 消息 传递 。 | 

(1) 基于 共享 内 存 的 同步 (shared-memory based synchronization) 的 工作 方式 是 : 通过 
挂 起 一 个 进程 ， 直 到 其 他 的 进程 用 合适 的 值 更 新 共享 内 存 。 在 这 样 的 情况 下 ， 共 享 内 存 可 以 
表示 一 个 事件 、 一 个 数据 值 或 是 系统 中 另 一 个 进程 的 状态 ， 如 图 3-10 中 的 Statecharts 语言 
FER o 

公共 事件 的 同步 (synchronization by common event) 要 求 一 个 进程 必须 等 待 一 个 特殊 事件 
的 发 生 ,而 这 个 事件 可 以 由 外 部 或 是 另 一 个 进程 来 产生 。 在 图 3-10a 中 ,我 们 可 看 到 事件 e 是 

如 何 分 别 同步 状态 A 和 状态 B, 并 进入 其 状态 中 同步 子 状态 A2 和 B2 的 。 另 一 种 方法 是 公共 
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变量 的 同步 (synchronization by common variable) , 它 要 求 某 一 进程 用 一 个 适当 的 值 更 新 其 变 


量 。 图 3-10b F, 当 我 们 给 状态 A2 中 变量 r 赋值 为 1” 时 ,状态 B 被 同步 到 子 状态 B2。 还 有 
一 种 方法 是 状态 检测 的 同步 (synchronization by status detection) ,一 个 进程 在 继续 执行 之 前 需 
检查 其 他 进程 的 状态 。 在 这 种 情况 下 ,通过 事件 e 触发 的 从 A1 到 A2 的 迁移 可 能 会 引起 B 
MARES B1 向 B2 的 迁移 ,如 图 3-10c 所 示 。 这 种 同步 的 方法 在 我 们 必须 有 效 表示 复杂 情况 时 
是 非常 有 用 的 。 这 种 情况 可 以 是 当 一 个 全 局 异步 收发 器 (universal asynchronous receiver-trans- 
mitter，UART) 进 入 接收 模式 时 ,需要 让 传输 者 的 输出 端 三 态 化 (tristating)。 





c) 状态 检测 的 同步 
图 3-10 Statecharts 中 数据 依赖 的 同步 


(2) 通过 消息 传递 同步 (synchronization by message-passing) 是 使 用 阻塞 通信 模式 的 另 一 
种 方法 。 在 这 种 情况 下 ,进程 已 经 准备 好 首次 发 送 或 接收 数据 ,但 它 必须 等 待 直到 男 一 个 进程 
也 准备 好 通信 。 例 如 ,CSP 模型 能 支持 这 种 同步 机 制 。 


3.2.8 异常 处 理 

通常 , 某 种 事件 的 发 生 要 求 一 个 行为 或 模式 能 立刻 中 断 , 这 样 就 能 阻止 其 行为 进一步 更 新 
它 的 值 。 因 为 与 行为 相关 的 计算 可 能 很 复杂 ,也 许 需 要 花费 无 限 的 时 间 来 处 理 。 这 样 ,有 必要 
用 称 为 异常 (exception) 的 一 种 事件 的 发 生来 立即 中 断 其 当前 的 行为 ,而 不 必 等 待 计算 的 完成 。 
当 这 样 的 异常 发 生 时 ,应 当 显 式 指 定 一 个 应 将 哪 一 个 控制 权 交 给 下 一 个 行为 。 计 算 机 系统 中 
的 复位 和 中 断 等 就 是 这 种 异常 的 例子 。 

通常 ,传统 的 有 限 状态 机 都 有 这 种 异常 处 理 机 制 。 在 这 样 的 状态 机 中 ,与 每 一 个 状态 相关 
动作 都 假定 其 执行 时 间 为 零 , 这 意味 者 一 个 异常 的 发 生 将 仅仅 引起 控制 交 给 下 一 个 合适 的 状 
态 。 另 一 方面 ,Statecharts 和 PSM 两 种 模型 都 允许 将 控制 交 给 更 高 层次 ,而 结束 低层 的 计算 ， 
以 这 种 方式 来 支持 异常 的 处 理 。 





3.2.9 非 确定 性 

对 于 系统 中 一 个 特殊 的 状态 迁移 或 执行 的 计算 行为 ,偶尔 会 存在 多 种 实现 方式 。 在 这 种 
情况 下 ,系统 设计 者 可 能 并 不 希望 在 描述 阶段 就 限制 系统 的 任何 一 个 特别 选择 。 在 概念 模型 
中 ,这 就 是 一 个 非 确 定性 的 值 , 它 允 许 设 计 者 对 于 任何 系统 执行 的 动作 或 计算 ,指定 其 多 种 选 
择 方式 。 在 对 行为 描述 模拟 时 ,可 以 任意 选择 其 中 之 一 来 执行 。 

在 概念 模型 中 ,有 两 种 类 型 的 非 确 定性 行为 。 第 一 种 是 选择 非 确定 性 (selection non- de- 
terminism) , 即 几 种 选择 方案 之 一 的 非 确定 性 选择 。 例 如 ,考虑 下 面 的 描述 ,其 中 a 和 2 是 两 
个 不 同 的 动作 : 

if (x) then 

do EITHER a OR b 

end if 
上 面 语 句 的 语义 是 当 r 的 值 为 真 时 ,允许 执行 a 或 2 任 一 种 操作 ,但 不 允许 同时 执行 两 种 操 
作 。 这 样 非 确定 性 的 例子 在 CSP 概念 模型 中 也 存在 ,通过 使 用 保护 (guarded) 语 句 指明 其 非 确 
定性 。 

第 二 种 类 型 的 非 确定 性 是 顺序 非 确 定性 (ordering non-determinism) , 它 指 的 是 几 个 执行 的 
动作 间 非 确定 的 顺序 。 例 如 ,考虑 下 面 的 语句 : 


if (x) then 
do BOTH a AND b 
end if 
47 值 为 真 时 ,上 面 的 语句 调用 将 同时 执行 两 个 动作 a 和 2 ,但 是 它们 两 者 执行 的 顺序 却 是 以 
一 种 非 确 定性 的 方式 进行 的 。 通 过 使 用 这 种 非 确 定性 , 系统 设计 者 可 避免 在 系统 描述 阶段 必 
须 指定 其 动作 精确 执行 顺序 的 问题 。 


3.2.10 时 序 

在 系统 描述 中 ,时 序 是 一 个 反映 真实 世界 实现 的 重要 部 分 。 换 名 话说 ,通过 指定 时 序 , 系 
统 设计 者 可 从 系统 模拟 结果 中 得 到 更 为 真实 的 信息 。 一 般 来 说 ,指定 系统 的 时 序 信息 分 为 两 
类 ;功能 时 序 和 时 延 约束 。 

1. 功能 时 序 

影响 系统 描述 的 模拟 输出 结果 的 时 序 信 息 全 都 属于 这 一 类 功能 时 序 ,因此 能 把 它 增 加 到 
系统 的 功能 性 中 。 例 如 在 状态 图 模型 中 ,可 决定 在 模式 或 状态 下 所 花费 的 最 大 时 间 ,以 指定 其 
时 间 间 隔 。 另 一 个 例子 是 利用 VHDL[IEE88] 中 的 wait 语句 ,以 及 在 未 来 的 某 个 时 间 里 用 
VHDL 信号 赋值 语句 更 新 其 信号 值 , 表 示 时 间 的 间隔 。 例 如 ,考虑 下 面 的 VHDL 语句 : 

a <= 30; 

wait for 100 ns; 

s< = a t 1 after 30 ns; 
对 信和 号 s 的 赋值 语句 将 在 对 a 赋值 后 的 100 ns 执行 。 然 而 ,由 于 在 s 的 赋值 语句 中 有 after 18 
句 ,信号 值 将 会 在 对 a 赋值 后 的 130 ns 时 得 到 更 新 。 





RR IES 47 


2. 时 延 约束 

对 一 个 系统 指定 的 时 延 约束 可 被 综合 和 验证 工具 利用 。 例 如 ,在 综合 过 程 中 一 个 严谨 的 
性 能 约束 将 影响 为 执行 计算 的 系统 资源 是 如 何 分 配 。 我 们 也 可 通过 验证 工具 检查 这 些 幼 束 是 
否 被 满足 。 这 样 的 约束 可 能 不 会 影响 系统 的 功能 性 ,从 某 种 意义 上 来 说 ,它们 也 不 会 影响 描述 
的 模拟 结果 。 

对 于 系统 而 言 , 有 几 种 时 延 约 束 的 方式 。 例 如 ,对 于 执行 时 间 的 约束 能 够 作为 行为 或 行为 
的 一 部 分 给 出 。 如 图 3-11a 所 示 ,行为 B 被 指定 了 一 个 10 ms 的 时 延 约束 。 在 其 他 情况 下 ,一 
个 行为 可 能 有 相关 数据 传输 率 上 的 约束 , 它 指定 在 此 行为 消耗 或 生成 数据 时 必须 达到 的 一 个 
速率 。 例 如 在 图 3-11b 中 ,行为 Q 限制 最 大 速率 为 10 Mb/s, 生 成 在 通道 C 上 要 传输 的 数据 ， 
该 数据 随后 将 被 行为 已 使 用 。 最 后 ,交互 事件 的 时 延 约 束 常 常 被 用 来 指定 两 个 不 同事 件 之 间 
发 生 的 最 小 /最 大 时 间 间 隔 。 例 如 在 图 3-11c 中 , 当 信和 号 in FE 50 ns 后 ,信号 out 上升。 


时 间 
a) 行为 的 执行 时 间 b) 数据 传输 率 c) 交互 事件 
图 3-11 系统 描述 中 的 时 延 约束 


在 时 延 约 束 的 描述 中 ,把 约束 和 概念 模型 中 的 特殊 对 象 相关 联 是 非常 重要 的 。 例 如 ,如 采 
设计 者 希望 在 一 个 行为 中 限制 两 个 语句 间 的 执行 时 间 时 ,需要 定义 一 个 语句 标号 ,以 指定 哪 两 
个 语句 间 的 时 间 约 束 。 而 在 两 个 1/0 事件 之 间 ,指定 约束 的 最 简单 方法 是 使 用 时 序 图 (timing 


diagrams)。 


3.3” 贬 入 式 系统 的 描述 要 求 


在 前 面 的 章节 中 ,我 们 已 经 介绍 了 不 同 概念 模型 中 一 系列 的 特性 。 然 而 ,应 当 重 点 注意 的 
是 ,不 同类 型 的 系统 可 能 只 需要 这 些 特 性 中 某 一 类 特殊 的 子 集 。 如 果 是 这 种 情况 ,对 于 一 类 特 
殊 系 统 的 概念 化 描述 ,要 求 一 个 具备 合适 特性 子 集 的 概念 模型 。 在 这 一 节 中 ,我 们 将 讨论 一 些 
适合 于 概念 化 描述 散人 入 式 系 统 特性 的 特殊 集合 。 

一 个 嵌入 式 系统 是 指 它 的 行为 与 其 所 处 的 环境 相互 作用 ,通常 在 一 个 模式 集合 中 使 其 顺 
序 化 ,而 每 一 个 模式 可 以 代表 一 个 状态 或 者 计算 。 一 般 来 说 ,这 样 的 系统 会 响应 外 部 事件 ,并 
以 其 输入 和 当前 状态 的 函数 来 计算 它们 的 输出 。 和 骨 人 式 系 统 的 例子 如 控制 器 和 电信 系统 。 在 
下 面 的 列表 中 ,我 们 讨论 了 嵌入 式 系统 中 几 个 典型 的 特性 ,其 中 有 一 些 虽然 已 经 在 3.2 他 中 简 
要 介绍 过 ,但 我 们 还 是 在 此 对 这 些 特性 重新 进行 讨论 : 

1) 状态 迁移 : 嵌 人 式 系统 从 本 质 上 来 说 是 基于 状态 的 ,通常 会 根据 外 部 事件 从 一 种 模式 
迁移 到 另 一 种 模式 。 在 某 些 情况 下 ,这 种 状态 之 间 的 迁移 是 以 一 种 无 规律 的 方式 发 生 , 如 图 
3-12a 中 所 示 的 模式 P.Q AR 之 间 所 存在 的 关系 。 

2) 行为 层次 化 : 当 我 们 把 系统 功能 性 看 成 是 由 层次 化 的 顺序 和 并 发 行为 的 集合 组 成 时 ， 
骨 入 式 系统 就 更 容易 被 定义 。 例 如 ,考虑 图 3-12b 中 骨 人 式 系统 所 实现 的 功能 性 ,这 个 系统 被 
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描述 成 四 个 不 同 的 行为 P.Q 、R 和 S。 当 行为 P 执行 后 , 紧 接 着 是 两 个 并 发 的 行为 Q@ MR A 


行 ,最 后 才 执行 行为 S。 应 当 注 意 的 是 ,这 四 个 行为 中 的 任何 一 个 行为 都 有 可 能 是 实现 (任意 ) 
复杂 的 计算 ,其 至 可 以 被 分 解 成 男 外 的 由 顺序 /并 发 子 行为 组 成 的 附加 层次 。 因 为 一 个 嵌入 式 
系统 可 由 儿 种 模式 组 成 ,而 每 一 种 模式 都 可 以 分 别 响应 不 同 的 外 部 事件 ,可 见 , 就 描述 的 规模 
和 可 读 性 而 言 , 行 为 的 层次 化 对 于 系统 的 复杂 度 管理 非常 重要 。 

3) 并 发 性 :媒人 式 系统 通常 由 一 些 并 发 行为 组 成 ,而 这 些 行为 为 了 能 实现 系统 整体 的 功 
能 ,彼此 之 间 需 要 相互 协调 。 对 于 这 样 的 系统 ,任务 级 和 语句 级 的 并 发 都 是 基本 的 要 求 。 

4) 异常 : 某 些 事件 要 求 系统 给 出 瞬间 
的 响应 。 这 种 情况 下 ERAS SER) BEA K 开始 
会 被 中 断 。 它 们 通常 结束 当前 的 计算 ,并 迁 “ ， 人 必 
移 到 另 一 种 计算 模式 下 以 响应 这 种 异常 情 = 
况 的 发 生 。 图 3-12c 解释 这 种 瞬间 中 断 的 © 
概念 。 随 着 事件 。 的 发 生 , 行 为 P 所 执行 
的 计算 将 被 中 断 , 而 控制 也 将 转移 到 行为 “并 
Q ,同时 Q 的 计算 被 初始 化 。 

5) 程序 设计 结构 :嵌入 式 系统 执行 的 a 状态 迁移 b) 顺序 / 并 发 行为 分 解 o) 异常 
某 些 计算 可 通过 更 加 自然 的 方式 来 表示 ,如 图 3.12” 嵌 人 式 系统 的 特性 
数学 表达 式 , 或 依赖 于 程序 设计 结构 (如 分 
支 和 循环 渤 代 ) 的 算法 。 

6) 行为 完成 :在 嵌 人 式 系统 中 ,许多 行为 既 不 是 无 限 循环 的 ,也 不 能 单独 通过 外 部 事件 来 
使 之 结束 。 然 而 ,这 些 行为 的 执行 是 在 行为 达到 某 个 完成 点 后 才能 继续 的 。 由 于 这 个 特性 ,我 
们 必须 能 够 指定 行为 的 完成 。 这 一 点 非常 重要 ,因为 我 们 可 能 希望 以 这 样 的 行为 完成 为 基础 ， 
初始 化 另外 一 个 行为 的 执行 。 


3.4 描述 语言 综述 
基于 嵌入 式 系统 的 这 些 特性 ,现在 我 们 将 简要 地 介绍 一 些 被 广泛 使 用 的 描述 语言 。 我 们 


选择 的 这 些 语言 包含 广泛 的 描述 方式 和 应 用 领域 ,并 对 当前 的 设计 描述 方法 具有 相当 的 代表 
性 。 在 本 节 中 ,我 们 特别 关注 每 一 种 描述 语言 是 怎样 支持 骨 入 式 系统 行为 描述 的 。 


3.4.1 VHDL 

VHDL(VHSIC Hardware Description Language) 是 由 美国 国防 部 提出 并 发 展 的 ,在 1987 
年 成 为 IEEE 的 标准 。 这 种 语言 能 帮助 设计 者 进行 硬件 开发 ,使 设计 文档 化 ,并 能 促进 设计 的 
相互 交换 。 随 着 它 的 不 断 发 展 ,VHDL 已 经 被 许多 设计 单位 作为 一 种 描述 语言 而 广泛 接受 ， 
同时 以 之 为 基础 开发 了 一 系列 的 工具 ,来 对 一 个 设计 进行 捕获 (使 用 图 形 化 前 端 工具 )、 模 拟 、 
调试 、 验 证 和 综合 。 . 

在 VHDL 中 基本 的 硬件 抽象 是 一 个 设计 实体 (design entity) , 它 通常 被 用 来 标识 和 表示 一 
个 较 大 设计 中 的 一 部 分 ,执行 特定 的 功能 ,并 指定 其 输入 和 输出 。 使 用 程序 设计 语句 数据 流 、 
结构 或 是 它们 的 组 合 ,可 描述 每 一 个 设计 实体 的 功能 性 。 

在 VHDL 中 ,结构 层次 化 (structural hierarchy) 是 通过 使 用 内 舱 的 块 和 元 件 实 例 化 (com- 
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ponent instantiation) 语 句 来 支持 的 。 图 3-13a 中 给 出 了 一 个 模 10 计数 器 的 结构 描述 。 该 计数 
器 有 两 个 外 部 端口 clk Ment, 在 每 一 个 时 钟 信号 clk 上 升 沿 进 4 了 计数 ， 当 计数 到 9 时 重新 设置 
回 0。 在 结构 体 声明 部 分 ,声明 所 有 被 使 用 的 元 件 ,指定 其 形式 端口 参数 (Reg _E, Add _E 和 
Cmp _E)。 然 后 ,元件 在 结构 体 部 分 被 实例 化 (Conreg ~ Adder 和 Comparator). TGF È W) 
互联 是 由 元 件 端 口 之 间 的 关联 来 指定 的 。 例 如 ,信号 cnt _out 被 分 别 上 映射 到 元 件 Conreg 和 
Adder 的 形式 端口 。 和 a 上 。 这 样 ,就 指明 Conreg 的 输出 端口 和 Adder 的 一 个 输入 端口 相 
连 。 


on (ok tte ent : out 
entity Counter_E is on (cik mbt out integer); 
port (clk : in bit; cnt : out integer); 
end Counter. E, architecture Counter beh of Counter_E is 
architecture Counter_struct of Counter_E is begin 
process 
component Reg E , _ 
pot (5: mvaeger; ck: bl o: out integer variable convar : integer = 0; 
ar: in bit); 
end component wal unt (oe) and not(cik’stable) ; 
comar = 0: 


component Add _E 
port (a, b:ininteger; o: out integer ) ; 
component ; 


component Cmp_E 
ong oi. i : in integer ; 0 : out bit ) 
end component ; 


port map (cnt_out, one, add_out) ; 
Comparator : Cmp. E 
_Port map (nine, cntin, clear); 





a) 结构 描述 c) 数据 流 描 述 


3-13 一 个 模 10 计数 器 的 三 种 方式 的 VHDL 描述 


VHDL 支持 两 级 的 行为 层次 (behavioral hierarchy). 在 顶级 ,描述 被 分 解 成 并 发 执行 的 进 
程 集合 ,以 支持 任务 级 的 并 发 。 第 二 级 则 将 这 些 进 程 分 解 为 顺序 过 程 。 

除了 传统 的 程序 设计 变量 之 外 ,VHDL 还 有 信号 的 概念 。 信 号 不 同 于 变量 ,因为 它 的 值 
是 以 时 间 定 义 的 。 这 样 , 除 当前 值 之 外 ,信号 都 有 一 个 输出 波形 。VHDL 的 信和 号 赋值 语句 文 
持 语句 级 并 发 (statement-level concurrency) , 像 下 面 所 示 的 例子 : 


a<= b; 
b< = a; 


wait on a; 


这 两 个 赋值 同时 发 生 ,并 交换 信号 a 和 8 的 值 。 此 外 ,VHDL 中 的 after 语句 允许 使 用 信号 赋 
值 语句 来 使 一 个 信号 的 值 在 未 来 的 某 个 时 刻 得 到 更 新 。 这 样 ,如 3.2.1 节 中 讨论 过 的 那样 , 文 
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持 隐 式 的 语句 级 并 发 。 | 

VHDL 也 完全 支持 程序 设计 结构 ,因为 一 个 进程 是 由 顺序 化 语句 组 成 ,类 似 于 ADA 程序 
设计 语言 中 的 特性 。 图 3-13b 显示 了 一 个 简单 模 10 计数 器 的 进程 描述 。VHDL 也 提供 广泛 
的 适合 于 高 层 建 模 的 数据 类 型 ,如 整 型 \ 实 型 枚 举 物理 数组、 记录 和 指针 类 型 。 

VHDL 中 并 发 信号 赋值 的 特性 允许 设计 者 描述 数据 流行 为 ,如 图 3-13c 中 表示 的 计数 器 
模 10 的 数据 流 描述 。 

此 外 ,进程 间 的 通信 可 通过 共享 内 存 模型 来 实现 。 共 享 内 存 模 型 使 用 一 些 可 被 任何 进程 
赋值 的 信号 线 , 同 时 对 于 其 他 进程 也 是 可 见 的 。 

VHDL 中 的 同步 有 两 种 实现 方式 。 第 一 种 方法 依赖 于 进程 的 敏感 列 表 (sensitivity list), 
它 确保 了 当 在 敏感 列表 中 任何 一 个 信号 有 事件 发 生 时 ,进程 将 被 激活 执行 。 例 如 ,考虑 一 个 进 
程 P, 它 被 定义 为 : 

P: process (start, x) 

begin 


end process; 


根据 这 个 定义 ,进程 P 将 挂 起 ,直到 在 信号 start 或 x 发 生 事件 后 激活 。 这 样 使 设计 者 可 通过 
start 或 工 信 号 ,同步 进程 P 与 其 他 进程 间 的 执行 。 

同步 的 第 二 种 方法 是 采用 一 个 wait 语句 , 它 挂 起 一 个 进程 ,直到 它 检 测 到 在 指定 的 信号 
之 一 上 有 事件 发 生 , 或 是 满足 指定 的 条 件 后 激活 。 例 如 ,下 面 的 wait 语句 确保 了 只 有 当 信 号 
xy 有 事件 发 生 , 或 者 start 的 值 为 1 时 ,进程 才 会 继续 执行 。 


wait on x, y until (start = ‘1’); 


VHDL 语言 中 的 时 序 描述 仅 限 于 功能 时 序 的 描述 ,例如 after 子 句 (如 a< = 2 after 20 
ns) 指 明 在 未 来 的 某 个 时 间 点 上 信号 值得 到 更 新 。 同 理 ,一 个 时 间 子 句 , 例 如 wait on start 
for 100 ns, 可 以 被 用 来 指定 在 wat 语句 等 待 的 最 大 时 间 。VHDL 语句 也 能 通过 预定 义 的 表 
ER now 评估 一 个 全 局 时 间 的 当前 值 。 虽 然 时 序 特性 的 第 二 种 类 型 即时 序 约束 在 VHDL 中 
并 不 被 直接 支持 ,但 是 可 使 用 属性 来 间接 指定 。 

与 舱 入 式 系统 相关 的 特性 相 比 ,VHDL 语言 在 一 些 方面 同样 也 不 支持 。 例 如 , VHDL 没 
有 一 个 能 响应 异常 并 结束 进程 的 结构 。 通 过 使 用 VHDL 中 的 guarded 并 发 信号 赋值 语句 , 
常 仅 被 部 分 的 支持 。 在 异常 处 理 的 方法 中 ，block 语句 相关 的 guard 表达 式 将 控制 block 中 对 
信号 的 赋值 。 

最 后 ,需要 注意 的 是 VHDL 不 支持 状态 迁移 。 而 且 ,一 个 真实 的 行为 层次 化 ,其 中 并 发 是 
在 任何 层次 级 别 中 指明 的 ,这 种 方式 也 不 被 VHDL 文 持 。 


3.4.2 Verilog 

Verilog[TM91，SST901] 原 本 是 作为 一 个 专用 的 硬件 描述 语言 (HDL) 而 发 展 的 , 它 主要 是 
针对 数字 系统 的 描述 和 模拟 这 两 个 方面 。 然 而 在 1990 年 ,Verilog 已 经 发 展 到 公众 领域 ,因此 
它 也 被 作为 描述 语言 而 广泛 使 用 。 

对 于 设计 者 来 说 ,Verilog 有 很 多 优点 ,其 中 之 一 是 通过 人 允许 系统 分 解 为 一 些 层次 化 的 互 
联 模 块 (module) 而 支持 结构 层次 化 。 这 些 模块 都 可 用 两 种 方式 来 描述 ,或 者 用 其 他 更 低层 的 
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模块 来 说 明 ,或 者 用 一 个 程序 来 指定 其 行为 。 

在 Verilog 中 同样 支持 行为 层次 化 。 从 某 种 意义 上 来 说 ,在 层次 化 中 的 任何 一 个 级 别 , 进 
程 都 可 用 分 又 一 结合 语句 派生 并 发 的 子 进程 ,或 是 由 一 些 子 过 程 组 成 。 这 些 进程 的 描述 用 类 
C 的 语法 ,通过 程序 设计 结构 (programming construct) fork-join 来 实现 。 另 外 ,也 可 以 使 用 持 
续 赋 值 (continuous assignment) 语 名 捕获 数据 流 (dataflow) 行 为 。 

在 Verilog 中 ,通信 是 用 共享 内 存 模型 来 实现 的 。 通 过 使 用 连接 线 把 模块 寄存 器 和 内 存 
的 端口 相互 连接 起 来 ,建立 进程 之 间 的 通信 。Verilog 也 能 以 几 种 方式 来 支持 同步 ,因为 控制 
同步 可 以 使 用 分 又 -结合 结构 来 实现 ,观测 一 个 事件 值 改 变 的 事件 控制 语句 也 常常 用 来 同步 
不 同 进 程 之 间 的 计算 。 例 如 ,语句 : 


@ (negedge) clock#10 q=d; 


可 确保 在 时 钟 信 号 clock 在 变 成 低 电 平 的 10 个 时 间 单位 后 ,把 信号 a 的 值 赋 给 信号 g。 另 外 ， 
我 们 也 能 使 用 Verilog 的 wait 语句 来 实现 同样 的 效果 ,如 : 


wait (clock = 0); 
#10q = d; 


在 Verilog 中 通过 建立 门 与 网 时 延 的 模型 支持 时 序 (timing) 描 述 。 这 意味 着 对 于 每 一 个 
EF, 下降 和 翻转 的 时 延 ,Verilog 允许 设计 者 指定 其 最 大 、 最 小 和 典型 的 数值 。 男 外 ,Verilog 
同时 允许 设计 者 决定 在 一 定时 延 后 ,赋值 语句 中 的 其 信号 值 将 得 到 更 新 。 例 如 ,在 赋值 语句 
#10 q=d 中 , g 的 值 将 在 时 钟 信和 号 clock 下 降 沿 的 10 个 时 间 单 位 后 得 到 更 新 。 

Verilog 通过 使 用 disable 语句 也 能 处 理 一 些 异 常 (exception ) ， 它 能 禁止 顺序 语句 中 指定 的 
块 的 执行 ,把 控制 流转 移 到 这 个 块 后 面 的 语句 中 。 

最 后 ,还 应 指出 的 是 Verilog 不 文 持 状 态 迁 移 的 摘 述 。 


3.4.3 HardwareC 
HardwareC[ KD88] 专门 被 设计 为 面向 综合 的 硬件 描述 语言 。 它 以 C 程序 设计 语言 
[KR78] 为 基础 ,同时 具备 适用 于 硬件 描述 的 额外 定义 的 语义 和 结构 。 正 因为 这 些 特性 ,在 
Hercules 行为 综合 系统 [DK88] 中 选择 这 个 语言 作为 最 有 效 的 方式 来 指定 其 输入 。 
在 HardwareC 中 ,一 个 系统 的 描述 可 以 由 一 个 单一 层次 的 并 发 进程 组 成 ,它们 彼此 之 间 
相互 通信 。 这 些 进 程 可 以 包含 在 一 个 层次 化 的 块 中 。 在 这 种 情况 下 ,这 些 块 和 它们 之 间 的 互 
联 构 成 了 结构 层次 (structural hierarchy)。 
我 们 也 可 在 HardwareC 中 用 进程 的 方式 指定 任务 级 并 发 (task-level concurrency)。 每 一 
个 进程 通过 一 系列 顺序 操作 给 出 一 个 算法 的 描述 。 这 些 操作 可 以 是 以 C 语言 程序 设计 结构 
中 的 子 集 的 来 描述 。 每 个 进程 一 旦 完成 便 又 从 头 开始 执行 。 语 和 句 级 并 发 (statement-level con- 
currency) 通 过 使 用 并 行 复合 语句 ( 见 3.2.1 FRE 
HardwareC 中 不 同 进程 间 的 通信 (communication) 通 过 共享 内 存 或 消息 传递 模型 的 方式 来 
实现 。 例 如 ,端口 传递 (port passing) 是 假设 一 个 共享 的 媒体 已 存在 ,如 连接 信和 号 线 或 内 存 , 它 
们 将 连接 已 声明 的 端口 。 设 计 者 可 以 在 通信 的 进程 边界 或 它们 包含 的 块 中 定义 这 些 端 口 ,并 
使 用 显 式 的 HardwareC 命令 来 读 、 写 或 三 态 化 一 个 全 局 端口 。 用 来 进行 通信 的 协议 被 指定 为 
进程 描述 中 的 一 部 分 ,如 图 3-14a 中 所 示 ,图 中 进程 Main 通过 端口 n _p 提供 值 n 给 进程 Fac- 
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torial, FFA Reo x _p 的 结果 。 另 一 方面 ,消息 传递 (message passing) 通 过 声明 相互 通信 
的 进程 / 块 之 间 的 通信 通道 后 ,使 用 显 式 的 发 送 一 接收 结构 来 实现 数据 的 传输 与 同步 。 在 这 些 
通道 上 的 通信 可 被 同步 化 或 是 被 阻塞 。 使 用 这 些 结构 ,设计 者 仅 需 要 指明 用 握手 协议 的 方式 
实现 在 通道 上 数据 的 传输 ,而 相关 的 硬件 可 以 利用 综合 工具 来 自动 综合 生成 。 例 如 ,在 图 
3-14b F, 可 以 看 到 进程 Main 使 用 通道 ch1 来 发 送 值 ,并 使 用 通道 ch2 来 接收 结果 。 


process Main (n_p, r.p) process Factorial ( n_p, rp) 
out port n_p ; out oo ns 
in port rp; port rp; 


. _ n= read(n_p); 
write n_p=n; Np f" compute ial */ 


ical read (tp ewe Sa, 
} } 


process Main (cht, ch2) 
out channel chi ; 
in channel che; 





b) 消息 传递 
图 3-14 HardwareC 中 的 进程 间 通 信 


为 了 使 HardwareC 中 的 两 个 进程 同步 (synchronize) ,设计 者 可 以 使 用 阻塞 消息 传递 方式 。 
通过 使 用 一 个 msgwait 结构 ,可 以 检测 到 已 经 在 通道 中 等 待 的 未 决 消息 。 通 过 使 用 这 个 结构 ， 
设计 者 可 以 指定 一 个 进程 一 直 等 竺 来 源 于 另 一 个 进程 的 适当 信和 叶 , 这 个 信号 可 以 用 一 个 二 进 
制 位 的 消息 来 表示 。 

HardwareC 中 一 个 有 趣 的 特性 是 对 于 不 同 模 型 (例如 块 进程 .过 程 和 了 肾 数 ) 具 备 指定 参数 
化 描述 的 机 制 , 即 模板 (template)。 通 过 对 这 些 模 板 的 形式 参数 提供 整数 值 的 方式 来 使 之 实例 
化 ,同时 ,我们 利用 这 种 特性 来 描述 库 元 件 ,比如 用 位 宽 .输入 端口 数 等 形式 参数 来 描 述 加 法 器 
和 乘法 器 。 设 计 者 可 实例 化 一 个 模板 , 以 便 被 综合 工具 利用 的 绑 定 信息 为 方式 ,来 指定 它 的 一 
个 特定 实例 。 例 如 ,对 于 一 个 加 法 模板 的 特定 实例 ,可 绑 定 为 一 个 特定 的 加 法 操作 ,使 系统 设 
计 者 可 在 描述 级 上 指定 其 资源 的 共享 情况 。 

在 HardwareC 中 ,两 个 语句 之 间 的 时 序 约 束 (timing constraint) 的 指定 可 通过 在 每 个 语句 
加 一 标识 tag 或 label 实现 ， 而 后 使 用 标识 来 指定 约束 。 此 外 ,HardwareC 也 可 指定 资源 约束 ， 
以 决定 在 综合 设计 时 ,对 于 一 个 给 定 的 模型 ,能 有 多 少 个 实例 数 (类 似 于 在 高 层次 综合 过 程 中 
的 分 配 任务 [GDW1L91])。 | 

最 后 ,我 们 需要 指出 的 是 HardwareC 不 支持 数据 流行 为 .状态 迁移 以 或 异常 的 描述 。 


3.4.4 CSP 

在 多 处 理 器 机 器 上 运行 程序 的 时 候 , 传 统 的 程序 设计 语言 具有 较 大 的 局 限 性 。 为 了 克服 
这 一 局 限 性 ,C.A.R.Hoare 在 1978 年 提出 了 通信 和 顺序 进程 语言 (Communicating Sequential 
Process,CSP)[Hoa78]。 顾 名 思 义 ,CSP 允许 设计 者 用 一 系列 并 发 进程 来 描述 程序 ,通过 结构 
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来 简化 对 通信 和 进程 间 同 步 的 描述 。 另 外 ,CSP 作为 一 种 程序 设计 语言 ,也 能 用 来 描述 硬件 系 


统 [Aul91j。 | | 

一 个 CSP 程序 含有 一 系列 命令 (command)。 利 用 并 行 命令 parallel ,一 个 进程 可 以 被 派生 
为 在 层次 任何 级 别 的 车 于 子 进程 (任务 级 并 发 ) ,这 提供 了 对 行为 层次 化 的 支持 。 在 parallel 命 
令 中 所 有 进程 都 会 被 并 发 执行 , 当 所 有 这 些 进程 都 终止 后 ,parallel 命令 才 结 束 。 而 且 , 这 里 提 
到 的 进程 本 身 就 是 一 系列 命令 ,并 可 以 含有 属于 进程 自身 的 parallel 命令 。 

在 CSP 中 ,可 以 用 程序 设计 结构 来 描述 进程 ,而 子 程序 通过 协同 例 程 来 实现 ,这 意味 着 子 
程序 也 是 通过 进程 来 实现 , 它 和 调用 进程 并 发 执行 。 递 归 子 程序 可 通过 一 个 进程 序列 来 模拟 ， 
序列 中 的 每 个 元 素 都 表示 一 个 级 别 的 递归 。 | 

CSP 中 的 控制 结构 通过 命令 guarded 来 实现 ,该 命令 含有 一 个 监视 或 条 件 表 。 当 监视 表 
中 的 所 有 条 件 都 满足 的 时 候 , 这 个 命令 列表 将 被 执行 。 为 了 指定 guarded 命令 中 仅 一 个 命令 
被 执行 ,可 以 使 用 alternative 命令 来 进行 描述 。 这 样 , 在 C 语 言 中 的 “if 语句 


if (a > b ) max = a; 


else max = b; 
可 以 被 CSP 中 的 alternative 命令 描述 如 下 : 
[a > b— max: = alja < b> max : = b] 


在 使 用 alternative 命令 时 ,可 能 会 出 现 多 个 监视 条 件 同时 满足 的 情况 。 在 这 种 情况 下 , 需 
要 仲裁 的 guard, 来 决定 选择 和 执行 哪些 命令 ,产生 非 确定 性 行为 。 

在 CSP 中 没有 全 局 变量 。 因 此 ,并 发 进程 间 的 通信 只 能 通过 指定 显 式 input 和 output 命 
令 , 使 用 消息 传递 的 机 制 来 实现 。 两 个 进程 间 的 通信 只 有 满足 下 列 标准 的 时 候 才 会 发 生 : 


1) 在 第 1 个 进程 的 output 命令 中 ,指定 数据 传输 的 目的 地 是 第 2 个 进程。 

2) 在 第 2 个 进程 的 input 命令 中 ,指定 数据 接收 的 来 源 是 第 1 个 进程。 

3) 在 input 命令 中 ,接收 数据 的 目标 类 型 和 output 命令 的 表达 相符 。 

两 个 进程 间 通过 input/output 命令 的 通信 是 一 种 阻塞 式 通信 , 它 构 成 了 CSP 中 唯一 的 同 
步 机 制 oO 

值得 注意 的 是 ,CSP 也 有 自身 的 局 限 性 , 它 没有 提供 对 结构 、 状 态 转换 、 时 序 、 数 据 流行 为 
和 异常 处 理 的 支持 。 


3.4.5 Statecharts 

状态 图 表 Statecharts[ Har87，DH89] 语 言 最 初 是 为 描述 反应 系统 (reactive system) 而 设计 
的 ,这 种 系统 通常 是 由 事件 驱动 , 受 控 制 支配 的 系统 ,用 于 航空 控制 系统 和 通信 了 网络 等 。 状 态 
图 表 在 传统 有 限 状 态 机 的 基础 上 进行 了 扩充 ,增加 了 层次 、 并 发 和 通信 三 个 新 的 元 素 ,能 够 很 
好 地 对 目标 进行 描述 。 

为 了 介绍 状态 图 表 语 言 ,图 3-15 中 描述 了 一 个 通用 异步 接收 机 发 送 机 UART. REAR 
中 的 基本 对 象 是 状态 ,两 个 状态 之 间 的 转换 是 由 事件 和 条 件 的 组 合 所 决定 。 

状态 图 表 支 持 行为 化 层次 , 它 允 许 将 任意 描述 分 解 为 状态 的 层次 化 。 具 体 说 来 可 以 有 下 
面 两 种 实现 方式 : 

1) OR( 顺 序 ) 分 解 :将 一 个 状态 分 解 为 包含 顺序 的 子 状 态 和 转换 弧 的 状态 机 。 例 如 图 
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3-15 P, 状态 tx _ mode FFA idle W transmit 两 个 顺序 的 子 状态 。 

2) AND (并 发 ) 分 解 :将 一 个 状态 分 解 为 互 不 相关 的 子 状态 ,这 样 只 要 父 状 态 被 激活 ,所 有 
子 状态 都 能 同时 被 激活 。 在 图 3-15 中 ,不 相关 状态 (并 发 状态 ) 用 虚线 分 开 , 也 就 是 说 顶层 状 
A top _level _ uart 含有 三 个 并 发 状态 : transmitter ~ receiver M uart iode。 在 状态 图 表 中 ， 
AND 分 解 指明 了 任务 级 并 发 性 。 
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图 3-15 Statecharts: UART 的 部 分 描述 


在 传统 有 限 状态 机 中 ,状态 一 般 都 是 单一 层次 并 顺序 执行 的 ,可 能 出 现状 态 数 呈 指数 增长 
的 情况 。 状 态 图 表 人 允许 将 状态 分 解 为 顺序 和 并 行 子 状 态 , 以 避免 这 种 情况 的 发 生 。 每 个 动作 
都 被 认为 是 没有 时 延 的 计算 过 程 ,能 够 和 状态 转换 弧 和 状态 相关 联 。 动 作 和 状态 之 间 的 联系 
有 两 种 方式 :一 种 是 当 系 统 处 于 该 状态 的 时 候 不 断 执 行动 作 , 另 一 种 是 当 进 入 或 者 离开 该 状态 
的 时 候 执行 动作 。 状 态 图 表 允 许 在 层次 中 不 同 级 别 间 进行 状态 迁移 。 

在 状态 图 表 中 ,功能 时 序 是 通过 使 用 超时 转换 绝 来 指定 的 ,这 些 弧 定义 了 系统 在 这 个 状态 
下 能 够 花费 的 最 多 和 最 少 的 时 间 。 

状态 图 表 通 过 广播 机 制 来 实现 通信 。 当 系统 中 的 任何 部 分 产生 新 的 事件 、 变 量 更 新 或 者 
发 生 了 状态 转换 ,这 些 信息 都 会 被 立刻 传 到 状态 图 表 的 其 他 部 分 。 该 语言 的 一 个 有 趣 的 特性 
是 能 支持 多 种 同步 机 制 , 包 括 初始 化 .公共 事件 .公共 数据 和 状态 检测 等 方式 ,这 些 在 3.2.7 市 
中 有 详细 介绍 | 

为 了 确定 一 ”组 子 状态 中 的 起 始 子 状态 ,状态 图 表 还 支持 系统 历史 的 概念 。 例 如 在 历史 记 
录 (enter-by-history) 里 ,对 一 组 子 状态 ,控制 将 首先 进入 最 近 访 问 过 的 子 状态 

此 外 ,状态 图 表 还 能 描述 非 确 定性 行为 。 状 态 图 表 中 的 状态 可 以 同时 发 出 两 条 弧 ， 选择 哪 
条 弧 , 即 转换 到 哪 一 个 状态 具有 非 确定 性 。 

状态 图 表 的 缺点 在 于 它 不 支持 程序 设计 结构 ,也 没有 提供 对 绪 构 、 行为 完成 和 数据 流行 为 
的 支持 。 
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3.4.6 Argos? 

Argos [Mar91, Hal93] 是 一 种 用 于 描述 反应 系统 的 图 形 化 同步 语言 。Argos 的 基本 进程 
是 有 限 自 动机 , 它 能 接收 和 发 送信 号 。Argos 采用 和 状态 图 表 相 同 的 图 形 约 定 ,但 是 在 语言 
有 几 点 不 同 之 处 。 首 先 Argos 将 状态 间 的 约束 限制 于 同一 层次 ,因此 能 够 将 一 个 系统 分 解 为 
具有 更 好 的 模块 化 的 若干 子 系统 。 另 外 ,状态 图 表 中 将 所 有 事件 都 向 整个 系统 传播 ,为 了 减 小 
这 类 事件 的 规模 ,Argos 中 引 人 了 局 部 事件 (local event) 概 念 ,将 事件 的 处 理 局 限于 一 个 特定 的 
子 系统 或 模块 中 。 最 后 ,Argos 采用 了 自 终 止 机 制 (self termination) ,可 以 指定 行为 完成 。 

Argos 的 缺点 在 于 它 不 支持 程序 设计 结构 ,也 没有 提供 对 结构 或 数据 流行 为 的 支持 。 


3.4.7 SDL 
规范 与 描述 语言 (Specification and Description Language, SDL) [ BHS91 ] 由 CCITT 标准 

化 ,主要 用 于 电信 和 领域 中 的 协议 描述 。 

SDL 描述 主要 含有 层次 化 的 数据 流 图 ,其 叶 结 点 是 状态 机 。SDL 能 够 描述 层次 化 结构 。 
在 SDL 中 ,描述 的 目标 对 象 是 系统 , 它 能 够 用 层次 化 的 块 (block) 来 定义 , 块 是 SDL 中 主要 的 
结构 概念 。 每 个 系统 含有 一 个 或 多 个 块 ,这 些 块 都 通过 通道 (channel) 与 其 他 块 以 及 系统 边界 
相连 接 , 如 图 3-16 所 示 。 这 些 通道 实质 上 构成 了 信和 号 传递 的 通路 。 对 这 些 块 可 以 进一步 进行 
分 解 ,最 后 得 到 一 个 层次 化 的 树 形 描述 ， FRE ABT Be 每 个 叶 结 点 块 可 以 含有 一 个 或 
多 个 进程 。 





图 3-16 通过 层次 化 分 解 将 SDL 描述 分 解 为 系统 、 块 和 进程 


SDL 对 行为 层次 化 的 支持 是 有 限 的 ,这 是 因为 在 它 的 叶 结 点 块 描述 中 含有 单一 层次 的 进 
程 。 另 一 方面 ,SDL 支持 进程 的 状态 机 顺序 分 解 。 这 些 进 程 可 以 在 系统 初始 化 的 时 候 被 激 
活 , 也 可 以 在 系统 生存 期 里 被 其 他 进程 激活 。 一 旦 进程 建立 后 ,只 有 达到 停止 结构 才 会 终止 ， 
这 意味 着 SDL 支持 行为 完成 。 

SDL 的 每 个 进程 都 含有 一 个 状态 机 ,能 够 支持 状态 转换 。 变 量 可 以 在 进程 中 声明 和 赋 
值 ,进程 自身 可 以 存在 于 状态 内 或 在 状态 间 执 行 转换 。 在 转换 之 间 , 进 程 可 对 变量 进行 处 理 、 
做 出 决定 .建立 新 的 进程 实例 .向 其 他 进程 发 送信 号 ,以 及 激活 或 者 复位 产生 时 序 信号 的 时 钟 。 

进程 间 以 及 进程 和 块 的 边界 间 具 有 信和 号 通路 (signal route), 通过 在 这 些 通路 上 传递 信号 


O 本 小 节 原 书 未 标 章 节 号 , 译 者 添加 章节 号 ,并 将 后 面 的 章节 号 顺延 。 一 一 译 者 注 
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可 以 实现 通信 进程 。 此 外 ,SDL 中 每 个 进程 都 具有 一 个 输入 队列 ,用 来 对 输入 信号 进行 缓冲 。 


队列 中 的 信号 在 进程 处 理 后 将 从 队列 中 移出 。SDL 中 的 进程 可 以 检查 并 等 待 信号 满足 指定 
的 值 , 这 样 可 以 实现 同步 。 在 进程 中 声明 时 钟 对 象 ,在 预 设 时 钟 间隔 到 达 之 前 来 产生 时 钟 信 
号 ,这 样 可 以 在 SDL 中 进行 时 序 描述 。 

最 后 ,SDL 不 支持 数据 流 描述 程序 设计 结构 或 异常 处 理 。 


3.4.8 Silage 

Silage 语言 [HR92，Hil85] 的 提出 是 为 了 解决 数字 信号 处 理 (digital signal processing, DSP) ABE 
中 的 相关 问题 。DSP 系统 接受 连续 的 输入 数据 值 流 ,并 对 其 进行 一 系列 操作 。Silage 是 适合 支持 
这 种 系统 的 应 用 语言 , 它 仅 指定 处 理 数据 值 所 需 的 功能 应 用 ,而 不 涉及 变量 及 变量 的 赋值 。 

Silage 的 主要 优势 在 于 对 数据 流 进行 描述 ,如 数据 驱动 的 并 发 操作 。Silage 的 表达 式 表 未 
数值 流 ,例如 对 于 表达 式 a+5,a Mo 分 别 表示 数值 流 ,而 不 是 通常 程序 设计 语言 里 的 变量 或 
者 数组 元 素 。Silage 程序 接收 的 一 组 输入 值 以 同步 方式 到 达 。Silage 表达 式 的 结果 同样 是 数 
值 流 的 形式 。 一 个 Silage 程序 由 一 系列 定义 组 成 ,将 新 的 值 定 义 为 已 有 值 的 晒 数 。 因 为 这 些 
定义 并 不 代表 对 变量 的 赋值 ,各 语句 间 是 相互 独立 的 ,因而 与 顺序 无 关 。 

在 Silage 的 循环 中 ,每 个 流 的 元 素 都 依赖 于 这 个 流 的 前 一 个 值 ,这 在 一 定 程度 上 实现 了 功 
能 时 序 。 时 延 符号 @ 用 来 表示 流 的 前 一 个 值 ,如 下 面 的 语句 : 

d = d@i + 1; 
在 这 个 流 中 的 值 用 d 来 表示 ,每 次 的 值 都 比 前 一 个 值 高 1。 

Silage 具有 数组 结构 (array constructor) ,能 够 精确 地 表达 向 量 元 素 。 另 外 , 求 和 与 求 最 大 
值 等 归 约 运算 可 对 整个 数组 进行 操作 。 在 监视 条 件 的 基础 上 ,条 件 表达 式 能 够 在 一 系列 表达 
式 中 选取 一 个 表达 式 。Silage 还 具有 部 分 去 除 (decimate) 和 内 插 (interpolate) 等 对 于 流 的 操作 ， 
可 分 别 对 不 同 信号 的 采样 率 进行 增加 或 减少 。Silage 中 的 函数 表达 了 一 组 定义 ,通过 宏 展开 
的 模式 来 实现 。Silage 中 不 允许 递归 或 非 静 态 边界 的 循环 。 

由 于 Silage 是 作为 一 种 应 用 语言 提出 的 , 它 不 支持 一 般 程 序 设计 语言 结构 。 此 外 ,如 上 文 
所 述 , 它 没有 变量 .赋值 操作 和 状态 转换 ,也 不 支持 层次 化 行为 和 异常 处 理 。 


3.4.9 Esterel 

Esterel[ Ber91，Hal93] 是 一 种 用 于 开发 反应 系统 的 同步 程序 设计 语言 。 迄 今 为 止 , 它 已 经 
用 于 描述 控制 器 .通信 协议 、 人 机 接口 和 系统 驱动 等 领域 。 

Esterel 语言 是 基于 完美 同步 假设 (perfect synchrony hypothesis) , 即 程序 中 状态 的 控制 、. 通 
信和 计算 都 不 需要 时 间 。 程 序 设计 结构 在 Esterel 中 得 到 了 很 好 的 支持 ,层次 化 结构 也 能 通过 
层次 化 模块 指定 ,这 些 模 块 都 具有 定义 好 的 接口 ,并 能 表示 其 他 模块 。Esterel 中 提供 了 程序 
顺序 化 分 解 以 及 通过 并 行 语 句 来 实现 并 行 分 解 的 特性 ,这 些 特性 构成 了 对 层次 化 行为 的 文 持 ， 
在 语义 上 和 分 叉 -结合 语句 类 似 。 

Esterel 中 的 通信 是 通过 信和 号 的 广播 来 实现 的 ,也 就 是 说 一 个 进程 发 出 的 信号 将 被 其 他 所 
有 进程 所 检测 到 。Esterel 提供 了 多 种 处 理 异 常 的 方法 ， 例如 watching 语句 : 

do 
< 语句 > 
watching s 
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do-upto 语句 : 
do 
分 语句 > 


upto s 
以 及 trap 语句 : 
trap t in 
<n>; exit T 
| await s; exit T 
end 
当 含 有 信和 号 s 的 事件 发 生 的 时 候 ,这 些 语 句 都 能 够 终止 它们 所 包含 的 语句 块 的 执行 ,在 这 一 功 
能 上 这 些 语句 是 相同 的 。 


同步 在 Esterel 中 也 有 多 种 表达 方式 。 例 如 await 语句 ,如 “await s.”, 保 证 当前 进程 等 待 “ 


指定 信和 号 的 发 生 。 另 外 ,如 果 我 们 指定 了 在 watching 或 do-upto 语句 中 的 语句 块 只 含有 停止 
(halt) 语 句 , 那 么 它们 也 可 以 用 来 同步 。 

然而 ,Esterel 不 含有 描述 状态 转换 .时序 和 数据 流行 为 的 结构 ,因此 并 完全 不 适合 于 描述 
tk ADR» 


3.5 SpecCharts 


在 3.3 WPA A RR SER ES ET TB, SR TT SB A BB A E 
这 些 特 点 。 本 节 将 介绍 SpecCharts 语言 , 它 专门 针对 这 些 特 性 的 处 理 , 能 够 直接 获得 概念 上 的 
模型 。 


3.5.1 语言 描述 

SpecCharts [NVG91a, NVG92, GVN93] 的 基础 是 第 2 章 中 介绍 的 程序 状态 机 (program- 
state machine, PSM) ,同时 也 是 VHDL 的 扩展 。 如 图 3-17 中 所 未 ,SpecCharts 中 的 基本 对 象 是 
行为 , 它 直 接 和 PSM 模型 中 的 程序 状态 相对 应 。 

SpecCharts 对 层次 化 行为 的 支持 体现 在 它 通过 层次 化 的 行为 来 描述 系统 ,其 中 的 每 个 行 
为 或 是 复合 行为 或 是 时 行为 。 

复合 行为 (composite behaviors) 可 以 被 层次 化 分 解 为 一 系列 并 发 的 子 行为 或 一 组 顺序 
行为 。 对 于 前 者 ， 当 该 行为 激活 的 时 候 ， 所 有 子 行为 也 都 被 激活 ; 而 对 于 后 者 ， 一 次 只 能 激 
活 一 个 子 行为 。 在 图 3-17 中 , 行为 B 和 XX 都 是 复合 行为 ， 其 中 B 含有 并 发 子 行 为 X、Y 和 
Z, X 含有 顺序 子 行为 X1 和 X2。 对 于 顺序 分 解 的 复合 行为 ， 子 行为 表 中 的 第 一 个 就 是 初 
始 行为 ， 在 父 行为 激活 时 将 控制 信号 传递 给 初始 行为 。 在 图 3-17 的 SpecCharts 描述 中 ， 当 
行为 和 被 初始 化 时 ， 其 子 行为 X1 将 激活 。 另 一 方面 ， 对 于 并 发 的 子 行为 ， 它 们 的 顺序 则 
没有 任何 关系 。 

在 图 3-17 中 ,X1、X2、Y MZ 都 是 叶子 行为 。 叶 子 行为 位 于 层次 化 行为 的 底部 ,其 功能 
性 都 使 用 VHDL 顺序 语句 ,通过 程序 设计 结构 来 指明 。 | 

图 3-17 中 的 描述 X1 和 X2 位 于 其 父 行为 X 中 ,SpecCharts 通过 这 样 的 方式 将 子 行为 描 


人 ~ 





106 


58 # 3# 


ea rt ( Pin integer, Q 
0 : in integer; Q : out int ; 
ende g integer ) 
architecture A of E is 
begin 
behavior B type concurrent subbehaviors is 
type int_array is array (natural range <>) of integer; 
be signal M : int_array(15 downto 0); 
gin 


X: (TOC, true, complete); 
x: ists 63, orne) 


behavior X type sequential subbehaviors is 
Xt: ff e1, X2); 
X2: (TOC, e2, complete); 
behavior X1 type code is ....... vs 
behavior X2 type code is ......... 
end X; 
behavior Y type code is 
variable max: integer; 
begin 、 


max := 0; 
for Jin 0 to 15 loop 
if (M(J) > max) then 
max 二 M(J); 


e i 
end loop; 
end Y; 
behavior Z type code is ........ 


end B; 
end A; 


图 3-17 一 个 简单 的 SpecCharts 描述 


述 垦 套 在 父 行为 中 。 类 似 地 , 子 行为 描述 X.Y WZ 都 包含 于 行为 B ZA. 

SpecCharts 也 支持 状态 迁移 。 从 某 种 意义 上 来 说 ,我 们 可 通过 一 系列 转换 弧 来 表示 子 行 
为 间 的 先后 顺序 。 在 SpecCharts 中 ,用 三 元 组 < T, C, NB > 来 表示 这 样 的 弧 , 其 中 工 表示 
迁移 类 型 ,C 表示 触发 该 迁移 的 事件 或 条 件 , NB 表示 迁移 的 下 一 个 行为 。 如 果 迁 移 不 需要 条 
件 ,那么 就 使 用 默认 的 “ 真 " 值 。 

和 PSM 模型 一 样 ,SpecCharts 有 两 种 类 型 的 迁移 弧 。 第 一 种 是 完成 迁移 弧 (transition-on- 
completion arc, TOC) , 当 迁 移 弧 的 源 行 为 计算 结束 ,并 且 满 足 相 应 条 件 后 , 则 转向 该 弧 指 办 的 
行为 。 对 于 一 个 叶 行为 , 当 其 所 含 最 后 一 个 VHDL 语句 执行 完 后 ,整个 行为 就 结束 ,此 时 所 有 
变量 和 信和 号 的 值 都 将 更 新 为 最 后 值 。 对 于 顺序 分 解 的 行为 ,结束 的 标志 是 生成 一 条 指 问 预 定 
义 结束 点 的 迁移 ,在 该 弧 表示 中 的 下 一 行为 域 以 complete 作为 参数 名 。 如 图 3-17 中 ,行为 
X 结束 的 标志 是 其 子 行为 X2 完成 操作 ,满足 事件 e2 ,并 将 控制 流 由 X2 转向 complete 完成 点 
(该 转换 弧 为 X2: < TOC，e2，complete > )。 最 后 ,对 于 并 发 分 解 的 行为 ,需要 其 所 有 (或 选 
择 的 一 定子 集 ) 子 行为 都 结束 后 , 父 行为 才 完 成 。 如 图 3-17 所 示 , 例 如 , 当 行 为 B 的 并 发 子 行 
为 X FLY 都 结束 ,控制 转向 完成 点 (相应 的 转换 弧 为 X: < TOC, true, complete >M Y: < 
TOC, e3, complete > ) 后 ,行为 B 才 完 成 。 需 要 注意 的 是 ,在 这 个 例子 中 ,行为 B 是 否 结束 和 
其 子 行为 Z 的 执行 状态 无 关 。 然 而 , 子 行为 Z 会 受到 行为 日 的 影响 ,也 就 是 说 当 X 和 了 都 转 
换 到 完成 点 ,也 就 是 B 完成 的 时 候 ,2 也 会 终止 。 | 
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H — FP LEE Bp by XE 43 HA (transition-immediately arc, TI) ,这 种 弧 在 满足 相关 弧 条 件 的 
时 候 立 即 进行 状态 转换 , 而 不 管 源 行 为 是 否 结束 其 计算 。 如 图 3-17 PHM X1: <TI, el, 
X2> , 当 事 件 el 满足 的 时 候 , 行 为 X1 立刻 终止 ,控制 转 同 行为 X2。 换 名 话说 ,即时 迁移 弧 
能 有 效 地 终止 源 行 为 所 有 低级 的 子 行 为 。 超 时 弧 (timeout arc) 是 一 种 特殊 的 TIW, CEANA 
指定 时 间 间 隔 后 进行 转换 ,由 行为 需要 被 激活 的 时 间 所 确定 。 

在 SpecCharts 中 ,每 个 时 刻 只 能 有 程序 状态 的 一 个 子 集 向 外 传送 计算 。 整 个 程序 状态 中 
只 有 根 结 点 是 一 直 处 于 激活 状态 , 它 代表 着 整个 系统 。 值 得 注意 的 是 ,SpecCharts 的 执行 方式 
和 VHDL 类似, 其 中 的 活动 行为 和 VHDL 中 的 基本 一 样 , 除 了 行为 中 不 含 隐 和 式 循 环 外 。 换 名 
话说 ,每 个 行为 都 将 一 直 执行 ,直到 碰 到 wait 语句 才 挂 起 , 两 个 连续 wait 语句 将 没有 时 延 ,所 
有 信号 都 将 在 6 时 间 内 更 新 。 不 活动 的 行为 和 VHDL 中 进程 的 挂 起 一 样 ,将 被 忽略 ,其 所 有 
的 信号 源 都 将 关闭 。 

在 所 有 顺序 子 行为 都 完成 后 ,如果 任何 TOC 迁移 弧 都 不 满足 条 件 , 系统 则 会 进行 隐 式 的 
等 待 状态 ,直到 满足 某 个 条 件 。SpecCharts 采用 确定 的 描述 ,从 某 种 意义 上 来 说 ,离开 一 个 子 
行为 的 迁移 将 放 在 描述 列表 的 优先 位 置 。 通 常 ,TI 弧 比 TOC 弧 有 和 较 高 的 优先 级 ,并 且 它 在 整 
个 层次 化 中 具有 最 高 的 优先 级 。 

SpecCharts 中 的 行为 可 以 含有 VHDL 声明 ,如 类 型 \. 信 号、 变量 和 过 程 ,其 作用 域 包括 了 
该 行为 的 所 有 子 行 为 。 

SpecCharts 有 两 种 支持 同步 的 方法 。 其 一 是 用 wait 语句 来 检查 事件 和 条 件 ,这 和 VHDL 
中 的 方法 一 样 。 如 下 面 的 语句 


wait until (start = ‘0’) and (not start’ stable); 


将 挂 起 当前 行为 ,并 等 待 信号 start 的 下 降 沿 。 第 二 种 方法 是 使 用 一 个 TI 迁移 弧 ， 从 行为 B 指 
回 自己 ,以 此 来 将 其 所 有 并 发 子 行为 同步 到 初始 状态 

和 VHDL 类 似 , SpecCharts 也 支持 层次 化 结构 ， 能 够 将 系统 或 者 系统 的 一 部 分 封装 为 实 
体 。 每 个 实体 都 可 以 声明 其 端口 ,通过 信号 和 其 他 实体 的 端口 相连 。 如 图 3-17 所 示 , 整个 层次 
化 行为 封装 为 实体 巨 , 声 明 的 端口 指定 该 实体 的 接口 。 | 

在 SpecCharts 中 , 通信 是 通过 变量 和 信和 号 来 实现 的 。 顺 序 行为 可 以 对 同一 个 变量 进行 读 
B , 而 并 发 行为 间 的 通信 需要 使 用 信号。 在 SpecCharts 中 ,还 可 以 定义 适当 的 发 送 - 接收 过 程 
来 指定 消息 传递 通信 。 由 于 VHDL 中 允许 对 子 程序 名 重 载 ,用 户 可 以 对 通道 中 不 同类 型 的 数 
据 都 定义 发 送 一 接收 过 程 。 

SpecCharts 中 可 以 在 信和 号 赋值 中 使 用 wait 语句 和 after 子 名 ,实现 时 序 描述 ,这 和 VHDL 
的 处 理 方法 一 样 , 此 外 ,还 可 以 用 超时 TI 缴 来 对 时 序 进行 描述 , 它 指定 一 个 行为 的 执行 时 间 
ERR. 


3.5.2 用 SpecCharts ARBRAR KE | 

上 一 节 已 经 对 SpecCharts 做 了 一 个 简单 的 介绍 , 接 下 来 将 针对 3.3 H RARA R 
统 描 述 要 求 , 说 明 如 何 用 SpecCharts KiB ARAB. 换 句 话说 ， SpecCharts 能 够 从 自身 的 
语言 结构 上 直接 映射 为 一 个 骨 人 式 系统 的 概念 模型 。 

图 3-18、 图 3-19 和 图 3-20 分 别 说 明了 如 何 用 SpecCharts 来 描述 状态 迁移 、 层 次 化 行为 和 
异常 ,通过 TOC 和 TI 弧 将 行为 进行 序列 化 , 以 此 来 处 理 状态 迁移 。 一 个 行为 可 以 含有 顺序 或 
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并 发 子 行为 ,这 样 可 直接 支持 层次 化 行为 。 通 过 TI 弧 可 以 直接 捕获 异常 , 需 注 意 的 是 ,图 中 左 
108) 边 的 概念 模型 和 右边 的 SpecCharts 描述 是 直接 相对 应 的 。 


Start 





behavior MAIN type sequential subbehaviors is 
in 
$ : (TOC, u, Q); 

Q : (TOC, v, P), (TOC, w, R); 

R : (TOC, x, Q); 

behavior P ..... 


behavior Q ..... 
behavior R ..... 


end MAIN; 








a) 期 望 功能 b) SpecCharts 描述 
图 3-18 ”描述 状态 迁移 


behavior MAIN type sequential subbehaviors is 


n 
> : Goe true, Q_R); 
Qn : (TOC, true, S); 






behavior P 一 一 
behavior Q_R type concurrent subbehaviors is 


8: FS: nus: complete: 






ererp 


LETETI 





behavior S. 
end MAIN; 





a) 期 望 功能 b) SpecCharts 描述 
图 3-19 ”捕获 顺序 /并 发 行为 分 解 


behavior MAIN type sequential subbehaviors is 
n 
: (Ti, e, Q); 
Q:; 


behavior P .... 
behavior P1 





a) 期 望 功 能 b) SpecCharts 描述 
图 3-20 ”捕获 异常 


此 外 ,SpecCharts 是 在 VHDL 语言 的 基础 上 建立 的 , 它 能 直接 使 用 VHDL 的 顺序 语句 来 
支持 程序 设计 结构 ,这 一 点 是 显而易见 的 ,最 后 ,行为 完成 可 以 通过 TOC 弧 和 完成 点 来 人 处理 。 
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3.5.3 ”等 价 图 形 化 表示 

在 图 3-17 中 ,我 们 引入 了 SpecCharts 语言 ,并 把 它 作为 文本 描述 方式 。 然 而 ,对 状态 转换 ， 
使 用 图 形 化 的 状态 迁移 图 更 容易 理解 。 为 此 ,在 这 个 观点 的 基础 上 , SpecCharts 语言 提供 了 等 
价 图 形 化 的 表示 ,以 一 种 可 视 化 的 形式 来 捕获 状态 迁移 结构 。 如 图 3-21, 我们 给 出 了 和 图 3-17 
中 文本 SpecCharts 描述 等 价 的 图 形 化 表示 ,在 某 些 情况 下 , SpecCharts 的 图 形 约定 和 [Har87] 
中 的 相 类 似 。 

在 图 3-21 中 ,和 矩形 框 代表 实体 , 圆 角 矩形 框 代 表 实 体 中 的 行为 ,用 虚线 分 隔 并 发 的 子 行 
为 ,用 箭头 表示 迁移 .对 顺序 分 解 的 行为 ,用 实心 倒 三 角 指定 第 一 个 子 行为 ,如 X1 是 行为 
的 初始 子 行为 顺序 分 解 行为 的 完成 通过 指向 完成 点 的 迁移 弧 来 指定 ,其 中 完成 点 用 实心 正方 
形 来 表示 , 并 位 于 该 行为 内 部 。 如 行为 X 中 , 子 行为 X2 在 满足 条 件 e2 的 时 候 转 到 完成 点 。 

TOC 和 TI 的 迁移 弧 有 不 同 的 图 形 表示 法 。TOC 弧 从 源 子 行为 内 部 的 实心 正方 形 出 发 
(如 标明 e2 和 e3 I), m TI 弧 从 源 子 行为 的 边界 出 发 (如 标明 el BM). 110 

最 后 , 系统 是 用 文本 描述 还 是 图 形 描 述 并 不 重要 ,相反 ,这 种 结构 能 更 好 地 体现 语言 的 优 
势 , 例 如 ,一 个 状态 机 可 通过 一 个 状态 表 的 文本 方式 来 描述 ,也 可 以 使 用 状态 迁移 图 进行 描述 。 
文本 和 图 形 描述 都 有 各 自 的 优点 ,但 最 重要 的 是 状态 迁移 自身 的 概念 , 它 在 某 种 环境 下 是 很 有 
价值 的 。 至 于 使 用 文本 还 是 图 形 方式 来 对 系统 进行 描述 ,已 经 超出 了 本 章 的 范围 。 





图 3-21 等 价 的 SpecCharts 图 形 表 示 


35.4 语言 的 可 扩展 性 
SpecCharts 语言 可 以 从 多 个 方面 进行 扩展 。 首 先 ,设计 者 经 常 需要 将 一 组 顺序 描述 的 行为 

分 解 为 一 组 并 发 子 行为 ,对 于 这 种 情况 ,将 分 叉 连接 语句 的 能 力 应 用 到 叶 行 为 上 很 有 用 。 其 次 ， 

系统 设计 者 可 能 希望 对 一 个 能 连续 执行 并 发 任务 的 行为 进行 描述 ,如 定义 一 个 信和 号 enabled, 





No 
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当 信 号 power 为 “on” 的 时 候 ( 即 , power = 1) 并 且 外 部 信号 reset 引 脚 为 低 ( 即 , reset = 0) 时 ， 


enabled 变 为 1。 根据 power 和 reset 信和 号 ,在 系统 生存 期 内 定义 enable , 这样 的 能 力 是 非常 有 用 
的 .如 下 面 的 VHDL 并 行 信号 赋值 语句 : 

block 

begin 

enable < = power and (not reset); 

end block; 

另外 一 种 有 用 的 扩展 是 支持 参数 化 行为 。 对 于 一 个 多 数 行为 都 类 似 的 大 型 .规则 系统 ,只 
需要 定义 少数 几 个 参数 ,并 指定 适当 的 参数 值 ,就 能 方便 地 对 所 需 的 行为 进行 实例 化 。 而 现在 
的 情况 是 ,即使 系统 中 有 NN 个 完全 相同 的 行为 ,它们 中 的 每 一 个 都 需要 用 SpecCharts 语言 
行 描述 。 
3.6 结论 和 发 展 方向 


本 章 的 目的 在 于 展示 概念 模型 特性 和 用 来 描述 这 些 特性 的 语言 结构 之 间 的 一 种 直接 映射 
的 关系 。 由 于 缺乏 一 一 对 应 的 关系 ,对 于 系统 描述 的 任务 是 非常 困难 的 ,容易 发 生 错误 或 是 不 
完全 的 描述 。 在 这 一 章 中 ,我 们 首先 给 出 了 通用 概念 模型 中 的 多 种 特性 ,接着 介绍 了 八 种 语 
言 ,说 明 这 些 语言 是 如 何 支 持 这 些 特性 的 ,如 图 3-22 所 示 。 对 于 骨 人 式 系 统 特定 实例 ,我们 给 
出 了 SpecCharts 语言 中 的 结构 能 够 容易 地 描述 PSM 模型 的 特性 ,并 能 够 很 好 地 适应 藤 入 式 系 
统 的 描述 。 语 言 和 模型 匹配 得 越 好 ,描述 所 需 的 时 间 就 越 少 ,描述 中 的 错误 也 越 少 ,为 外 ,描述 
本 身 的 综合 性 和 适应 性 也 就 得 到 了 提 融 。 
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图 3-22 ”各 种 语言 对 峙 人 式 系统 概念 模型 特性 的 支持 
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然而 ,应 当 意 识 到 , 随 着 语言 描述 所 处 层次 的 提高 ,语言 表达 能 力也 随 之 提高 ,由 此 带 来 的 
负面 影响 使 设计 实现 变 得 更 加 困难 。 例 如 ,即使 广泛 地 使 用 类 似 于 VHDL 语言 ,综合 工具 也 
只 能 处 理 语言 结构 的 有 限 子 集 。 如 果 语 言 不 仅仅 是 作为 文档 ,未 来 发 展 的 重点 将 是 它 的 可 综 
合 性 问题 。 特别 应 当 指 出 的 是 ,如 果菜 种 语言 特性 没有 硬件 的 支持 ,就 无 法 应 用 于 系统 建 模 ， 
除非 设计 者 不 需要 对 其 直接 进行 综合 。 此 外 ,系统 复杂 度 在 不 断 提 高 ,使 得 通过 模拟 验证 
(verification by simulation) 的 方法 是 不 可 行 的 ,因为 描述 中 有 大 量 的 信号 和 事件 ,因而 在 模拟 
中 可 能 的 情况 数目 也 都 变 得 十 分 庞大 , 这 无 疑 使 模拟 验证 变 得 不 可 管理 。 因 此 ,我们 需要 研究 
开发 一 种 能 自身 就 支持 形式 化 验证 技术 的 语言 ,这 样 才 有 可 能 对 系统 的 特性 进行 自动 验证 。 


3.7 练习 


1. 3.2 节 中 提出 了 概念 模型 的 特性 ,C 程序 设计 语言 支持 其 中 的 哪些 特性 ? 

2. 列举 下 面 系统 所 需 的 概念 模型 特性 : 
(a) 数字 信号 处 理 器 系统 ; 
(b) 通信 协议 ; 
(c) 数据 库 系统 ; 
(d) FHS REALE SE 

3. 从 同步 .通信 和 时 序 几 个 方面 对 比 VHDL, HardwareC. Statecharts, CSP, SDL 和 SpecCharts 
等 语言 , 列 出 每 种 语言 相关 的 结构 (提示 ,参考 [NG931])。 

4. 根据 图 35 中 的 层次 化 有 限 状 态 机 (FSM) ,生成 平面 有 限 状态 机 。 二 者 相 比 , 层 次 化 有 限 
状态 机 具有 什么 优点 ? 

5. 状态 图 表 Statecharts 概念 模型 可 处 理 状态 迁移 和 层次 化 的 特性 。 考 虑 一 个 具有 H 层 的 状 
态 图 表 ,在 每 一 层 都 采用 OR SHEN S 个 顺序 子 状态 ,每 个 子 状态 都 发 出 一 条 简单 迁移 绝 
( 即 每 一 层 有 S 个 迁移 弧 )。 假 设 没 有 层 内 迁移 , 求 状 态 总 数 和 迁移 总 数 。 

6. 如 果 将 上 题 中 的 状态 图 表 展 平 为 一 个 有 限 状 态 机 ,又 有 多 少 个 状态 和 迁移 ? 

7. FER VHDL 顺序 语句 计算 a b Mc 中 间 的 最 大 值 : 


process(a, b, c) 
begin 
if (a > b) 
then max < = a; 
else max < = b; 
end if; 
wait on max; 
if (c > max) 
then max < = c; 
end if; 
end process; 
用 VHDL 并 行 信号 赋值 重 写 上 面 的 数据 流 语句 。 
8. 对 比 VHDL 的 信号 和 变量 赋值 语句 的 语义 。 在 下 面 的 代码 中 ,如 采 a Mb 的 值 分 别 是 10 
和 20, 在 语句 执行 后 的 终 值 分 别 是 多 少 ? 


P 
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(a) 信号 赋值 : 
a<=b; 
b <= a; 


wait for 1 ns; 


(b) 变量 赋值 ; 
a: = b; 
b: = a; 
9. 分 别 用 Verilog, HardwareC. CSP. Esterel 和 SpecCharts 等 语言 对 图 3-13 中 的 模 10 计数 器 
115 进行 描述 。 
10. 考虑 下 面 的 语句 : 


a=1 
x = 3 
y= x tbh, 
b=at 1; 


并 假定 b 和 x 的 值 都 为 2。 如 果 上 面 的 描述 是 一 组 顺序 语句 , 执 竺 后 b M y 的 值 分 别 是 
116 多 少 ? 如果 是 数据 流 语句 ,5b My 的 值 又 是 多 少 ? 


B45 系统 描述 举例 


在 前 面 的 章节 中 ,我 们 知道 能 够 描述 系统 特性 的 最 好 语言 应 当 能 够 最 容易 抓 住 系统 自然 
模型 的 特性 。 本 章 我 们 将 给 出 一 个 小 而 完整 的 葡 入 式 系 统 的 实际 系统 描述 ,以 便 显示 出 概念 
模型 和 系统 描述 语言 之 间 的 匹配 所 带 来 的 优势 。 


4.1 引言 


本 章 中 ,我 们 将 用 一 个 电话 应 答 机 的 例子 来 演示 系统 概念 化 和 可 执行 功能 描述 的 开发 。 
我 们 从 一 个 对 从 入 式 系 统 功能 性 的 自然 语言 描述 开始 ,逐步 进入 到 SpecCharts 语言 的 PSM 模 
型 的 开发 。 我 们 将 看 到 用 一 个 可 执行 语言 描述 系统 比 起 用 英语 等 传统 自然 语言 描述 的 优势 。 

我 们 也 将 通过 几 个 实验 来 说 明 : 利 用 SpecCharts 描述 能 人 式 系统 比 用 VHDL 描述 在 获取 
时 间 、 理 解 时 间 和 功能 错误 方面 都 有 所 减少 。 减 少 的 原因 主要 由 于 SpecCharts 语言 对 PSM 模 
型 的 支持 。 我 们 还 给 出 一 个 能 显示 出 SpecCharts, VHDL 和 Statecharts 描述 之 间 差 别 的 实验 。 
最 后 ,我 们 将 通过 一 个 实验 来 证 明 利 用 可 执行 描述 进行 自 顶 向 下 的 设计 并 不 会 降低 系统 的 设 
计 质 量 。 


4.2 电话 应 答 机 


这 里 作为 举例 用 的 系统 是 当前 市 场 上 正在 使 用 的 一 种 电话 应 答 机 的 控制 器 。 控 制 器 的 运 
行 环 境 如 图 4-1 所 示 ,我 们 将 描述 这 个 环境 和 控制 器 的 接口 。 
| 电话 线 
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图 4-1 应 答 机 控制 器 的 环境 
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通知 单元 (Announcement unit) 用 来 记录 和 传播 一 个 较 短 的 外 发 通知 ,接口 包括 三 个 端口 ; 


ann rec: 指挥 该 单元 从 麦克 风 中 记录 电话 机 主人 的 通知 。 
ann _ play: ”指挥 该 单元 播放 通知 。 
ann_ done: ”指示 控制 器 ,通知 已 经 结束 。 


录音 记录 单元 (Tape unit) 用 于 在 磁带 上 记录 消息 并 重复 播放 ,接口 包括 五 个 端口 : 


tape _ rec: ”指挥 该 单元 把 来 电 记录 到 磁带 中 。 

tape _ play: ”播放 录音 。 

tape_fwd: ” 快 进 录音 。 

tape _ rew: 快 退 录 音 。 

tape _ count: 将 当前 的 录音 位 置 作 为 整数 传 给 控制 器 ,0 代表 录音 的 开始 。 

标准 的 线路 电路 (Line circuitry) 用 于 呼叫 应 答 ,来 电 检测 , 挂 断 检测 ,按键 音调 解码 和 产生 
蜂 鸣 。 控 制 器 与 该 电路 的 接口 有 五 个 端口 : 


tone: 代表 从 线路 上 检测 到 的 用 4 位 二 进 制 编 码 的 按键 音调 。 
hangup: 检测 线路 上 的 挂 断 。 | 

ring: 检测 线路 上 的 来 电 。 

offhook : 指示 线路 电路 进行 呼叫 应 管 。 

beep: 指示 线路 电路 在 线路 上 产生 蜂 鸣 。 


显示 模块 (display) 用 于 显示 当前 的 消息 数量 和 应 答 机 的 开 / 关 状态 ,接口 由 两 个 端口 组 


message : 用 5 位 二 进 制 表示 接收 到 的 消息 数量 并 显示 在 电话 机 屏幕 上 。 

light: 开局 表示 开机 状态 的 指示 灯 ,表示 应 答 机 已 经 建立 应 答 准 备 。 

九 个 触摸 按键 (touch-sensitive button) 用 于 应 答 机 用 户 编辑 通知 和 接听 消息 ,对 应 的 端口 

如 下 : 

on _ off: 置 位 电话 机 的 应 答 状 态 从 开 到 关 或 者 相反 , 当 置 于 开 状态 时 ,除非 将 电话 机 
设置 为 啊 铃 两 声 后 应 答 ,否则 电话 机 将 在 啊 铃 四 声 之 后 应 答 。 

play_ msgs: 从 开始 处 播放 消息 磁带 。 


fwd: 快 进 播放 消息 磁带 。 

play: 从 当前 位 置 播放 消息 磁带 。 

rew: 快 退 消息 磁带 。 

stop: 从 快 退 \ 快 进 、 播 放 和 录音 状态 下 停止 消息 磁带 。 


memo: 记录 麦克 风 消 息 蔡 代 记 录 通 话 记 录 。 
hear_ ann: ”播放 一 条 通知 。 
rec_ ann: 用 麦克 风 录 制 一 条 通知 。 


上 述 端 口 的 功能 和 通知 单元 、 录 音 记 录 单 元 上 端口 的 不 同 之 处 在 于 它们 仅 表 示 用 户 的 请 求 。 
只 有 当 控 制 器 适当 地 配置 了 通知 单元 或 录音 记录 单元 的 端口 之 后 ,这 些 动作 才能 真正 发 生 。 
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该 应 答 机 还 有 两 个 开关 ， 

power: 电话 机 的 开关 。 当 开关 处 于 “off" 位 置 时 ,电话 机 对 电话 呼叫 和 所 有 的 按键 动 
作 均 忽略 ,并 且 关 闭 消息 计数 显示 和 电话 机 状态 指示 灯 。 该 端口 不 同 于 on/ 
off 端口 ,这 个 端口 只 有 当 power 开关 处 于 “on” 位 置 时 才 指 示 电 话机 是 否 对 


呼叫 做 出 应 答 。 
tollsaver: ” 啊 铃 状态 指示 。 当 应 答 状 态 为 “on” 时 ,电话 机 在 记录 至 少 一 条 信息 之 后 应 当 
在 响 铃 两 声 后 应 答 (相反 的 情况 是 四 声 后 应 答 )。 120 


4.3 用 SpecCharts 进行 系统 描述 


我 们 现在 将 用 SpecCharts 来 获取 应 SPL 制 化 功能 性 的 一 个 可 执行 描述 。 前 面 各 章 所 介 
绍 的 图 形 结构 将 在 下 面 的 图 示 中 用 来 表示 组 合 行为 。 控 制 右 的 功能 性 描述 在 附录 A 中 用 自 
然 语 言 描述 ;下 面 介 绍 其 中 一 部 分 。 

首先 我 们 指定 系统 的 接口 。 图 4-2 给 出 了 接口 描述 的 一 部 分 ,该 描述 可 以 比较 容易 地 从 
4.2 节 的 接口 目 然 语言 描述 中 得 到 。 
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Sem = at ROK 


): 
end entity; 
architecture Controller_A of Controller_E is 





图 4-2 ”应答 机 控制 器 的 接口 


接 下 来 我 们 把 控制 器 的 行为 分 解 成 若干 简单 行为 ,进而 这 些 行为 又 可 以 继续 分 解 为 更 加 
简单 的 若干 子 行 为 ,直到 这 些 子 行为 可 以 用 顺序 语句 描述 。 

控制 器 行为 ;自然 语言 描述 称 “ 当 power 开关 处 于 “off 位置 时 , 电 
话机 忽略 线路 呼叫 和 所 有 的 按键 ”"。 因 此 ,在 抽象 的 最 高 层 ,控制 部 始 
终 处 于 两 种 模式 之 一 : “on”" 或 者 “off”。 我 们 将 控制 器 分 解 为 两 个 顺序 
的 子 行为 ,系统 开 (SystemOn) 和 系统 关 (SystemnOff) , WA 4-3 所 示 。 
如 果 在 系统 关 的 状态 下 power 变 成 1, 则 控制 器 进入 系统 开 状 态 。 一 条 
TI 弧 表 示 这 种 状态 迁移 。 类 似 地 ,也 有 一 条 弛 表 示 当 power 变 成 0 时 ， 
控制 器 回 到 系统 关 的 状态 。 这 样 的 on/off 分 解 在 许多 系统 中 都 很 常见 。 

系统 关 的 行为 : 当 系 统 为 “off" 时 , 它 处 于 完全 空闲 ,因此 系统 关 的 状态 不 包含 任何 功能 ， 
我 们 将 其 指定 为 仅 包含 单条 VHDL 描述 “null” 的 叶子 行为 。 

系统 开 的 行为 : 系统 处 于 “on” 状 态 的 功能 性 描述 可 以 分 解 为 两 个 部 分 :“ 响 应 外 部 按键 和 
开关 ”以 及 “响应 线路 呼叫 ”。 我 们 据 此 将 系统 开 分 解 为 两 个 子 行为 :按键 响应 Respond- 
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ToMachineButton 和 线路 响应 RespondToLine, 如 图 4-4 所 示 。 为 了 确定 它们 的 转换 关系 ,我 们 
注意 到 摘 述 状态 :电话 机 的 按键 的 啊 应 比 起 线路 响 
应 的 优先 级 要 高 ;因此 按 下 任何 外 部 按键 的 同时 也 将 
中 止 任何 当前 活动 。 这 有 段 描述 表明 电话 机 的 按键 将 
触发 即时 响应 。 因 此 在 图 中 用 一 条 从 线路 响应 到 按 rising(any_button_pushed) 
键 响应 的 TI 弧 来 表示 任何 按键 按 下 所 导致 的 状态 迁 A 
移 。 为 了 保证 可 达 性 ,我 们 创建 了 一 个 新 信号 ,any _ 
button _ pushed ,表示 所 有 电 语 机 按键 信和 号 iain o 图 4-4 系统 开 的 行为 

有 一 种 可 能 的 情况 是 当 控 制 硕 仍 在 啊 应 第 一 
按键 的 时 候 另 一 个 按键 又 被 按 下 。 例 如 ,如 果 ” ik oneness 系统 的 响应 是 将 磁带 倒 回 到 
开始 处 。 然 而 ,用 户 可 以 在 倒 带 到 开始 处 之 前 按 下 “停止 "*。 因 此 我 们 在 按键 响应 状态 上 增加 
一 个 TI 弧 自 环 来 表示 对 最 新 按键 的 啊 应 。 为 了 避免 在 单独 按 下 一 个 按键 的 处 理 过 程 中 , 系 
统 发 生 退 出 或 者 重 人 按键 响应 状态 的 非 期 望 行为 ,我 们 指定 状态 转换 只 能 发 生 在 any _ button _ 
pushed 信和 号 的 上 升 沿 处 。 

在 自然 语言 的 描述 中 没有 明确 说 明 回 到 线路 响应 状态 的 条 件 是 什么 。 由 于 没有 例外 能 够 导 
致 这 种 状态 迁移 ,我 们 假设 该 迁移 仅 发 生 在 对 按键 的 响应 结束 之 后 。 因 此 添加 一 条 从 按键 响应 到 
线路 响应 的 TOC 弧 ,默认 条 件 是 “gue” ,表示 当 按 键 啊 应 状态 结束 之 后 ,立即 回 到 线路 响应 状态 。 

按键 响应 的 行为 :不 同 的 按键 要 求 有 不 同 的 响应 处 理 (具体 的 响应 内 容 参 见 附 录 ) ,我 们 通 
过 一 个 过 程 来 描述 每 一 个 响应 ,并 且 利 用 if-then-else 语句 来 调用 每 个 特定 按键 所 对 应 的 处 理 
过 程 , 如 图 4-5a 所 示 。 注 意 , 当 一 段 代 码 执行 完毕 ,按键 响应 的 行为 结束 ,系统 将 如 前 所 述 返 
回 线路 响应 状态 。 








behavior RespondToMachineButton 
type code 





pent (Play 1 2, hen 

elsi! GR 1 pf then 
HandieFwd; 

elsif (rew 一 1’) then 
HandleRew; 








elsif (Stop= 1 ‘then 
HandleStop; 

elsif (hear ann='1’) then 
HandleHearAnn; 

elsif (rec_ann= 1 ‘then 
HandieR 


elsif {play YEN 1) then 
endif, 







end; 





a) 顺序 语句 bj 等 价 子 行为 分 解 
图 4-5 按键 响应 的 行为 
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我 们 也 可 以 用 与 前 面相 同 的 方法 将 按键 响应 分 解 为 若干 顺序 子 行为 。 每 个 子 行为 对 应 一 
个 特殊 的 啊 应 ,而 弧 线 指出 哪 一 个 子 行为 将 被 激活 ,如 图 4-5b Ro TOC 弧 从 每 一 个 子 行为 
出 发 指 问 按键 响应 行为 的 同一 个 特定 的 完成 点 。 两 种 描述 在 功能 上 等 价 ,因此 系统 建 模 者 可 
以 自由 选取 最 方便 和 可 读 性 最 强 的 描述 方法 。 
线路 响应 的 行为 :自然 语言 描述 中 提 到 , 当 电 话机 响应 线路 
呼叫 时 将 执行 以 下 三 个 任务 之 一 :“ 监 测 线路 的 响 铃 ”, 直到 响 铃 
计数 的 值 到 达 规 定 的 数目 ;“ 正 常 应答 活 动 ” ,播放 通知 同时 记录 
呼叫 信息 ; 远程 操作 应 管 活动 ” ,用户 (假设 为 机 主 ) 可 以 通过 播 
一 系列 的 按键 来 收听 到 呼叫 留言 。 我 们 认为 将 线路 响应 分 解 为 
两 个 主要 的 子 过 程 监 测 器 (Monitor) 和 应 答 器 (Answer) 是 最 容 
易 理解 的 ,如 图 4-6 所 示 。 正 常 应 答 和 远程 操作 应 答 的 区 别 将 图 4-6 线路 响应 的 行为 
在 后 面 的 应 答 器 行为 中 描述 。 
当 正 确 的 啊 铃 计数 被 监测 到 之 后 ， 监 测 器 结束 ， 同 时 应 答 器 激活 ， 因 此 从 监测 器 到 应 答 
器 之 间 添 加 一 条 TOC 绝 。 自 然 语言 描述 中 提 到 在 呼叫 信息 被 记录 之 后 ,“ 电 话机 挂 源 并 重新 
监测 啊 铃 "。 因 此 我 们 再 从 应 答 顺 到 监测 需 添 加 一 条 TOC MW, RIEM: “如 果 在 电话 机 
开始 应 答 之 后 “onvoff ”按键 被 按 下 ， 则 当前 的 活动 将 被 中 止 ， 电 话机 重新 监测 电话 线路 。 
由 于 有 人 可 能 在 收听 留言 时 拿 起 电话 并 按 下 “onvoff ”来 关闭 电话 机 ， 而 转 人 与 其 他 人 通 
话 ， 因 而 该 功能 可 以 用 于 屏蔽 呼叫 。 用 一 条 从 应 答 器 指 同 监测 右 的 TI 弧 来 表示 ， 转 移 条 
件 为 machine _ on 的 下 降 沿 。 如 果 当 前 电话 机 状态 为 “on”，machine _ on 信号 在 描述 中 为 
“true” 。 
自然 语言 描述 中 没有 明确 提 到 这 种 情况 :如 果 电 话 开 始 啊 铃 但 是 呼叫 者 已 经 在 被 应 答 前 
挂 断 ,监测 器 将 重新 启动。 我 们 在 监测 项 上 加 入 目 环 TI 弧 来 捕获 这 种 行为 ,如 果 检 测 到 挂果 
则 执行 该 状态 迁移 , 令 监 测 器 重 记 。 我 们 可 以 等 价 地 将 该 挂 断 行为 指定 为 监测 硕 的 一 部 分 ,加 
一 条 TI 弧 的 方案 可 以 导致 监测 器 行为 更 为 简单 。 
监测 器 行为 : 监测 器 监测 线路 上 的 响 铃 计数 直至 达到 要 求 的 数量 。 目 然 语 言 描述 在 多 个 
条 件 的 基础 上 给 出 了 三 种 不 同 的 可 能 性 : “ 当 电 话机 处 于 “on” 状 态 ， 电 话机 一 般 在 四 声响 
铃 之 后 应 答 。 然 而 ， 如 果 “tollsaver” 端口 处 于 “on” 并 且 至 少 记 录 了 一 条 信息 ， 电 话机 将 
在 响 铃 两 声 后 应 答 。Tollsaver 允许 机 主 通 过 电话 来 判定 是 否 有 任何 消息 被 记录 。 如 果 电 话 啊 
三 声 ， 说 明 没 有 任何 消息 ， 机 主 可 以 挂 断 电话 从 而 避免 了 长 途 通 话 的 费用 。 有 时 候 机 主 可 
能 在 离 家 之 前 忘记 了 打开 电话 机 ， 因 此 即使 处 于 “off” 状 态 ， 电 话机 仍 将 在 响 铃 十 五 声 以 
后 应 答 。 
虽然 自然 语言 描述 没有 明确 说 明 ,这些 条 件 也 将 在 电话 响 铃 之 后 改变 。 举 个 例子 ,假设 要 
求 应 答 的 响 铃 数 为 十 五 , 且 当 前 呼叫 已 经 响 铃 五 次 。 假 设 此 时 machine _ on 信号 变 为 “1”, 使 
得 要 求 应 答 的 响 铃 数 变 为 四 ;该 呼叫 也 应 当 立 即 被 应 答 。 
监测 器 可 以 被 描述 为 两 个 并 行 的 子 行为 :一 个 用 于 计算 应 答 前 等 待 的 响 铃 数 , 男 一 个 用 于 
响 铃 计数 并 且 在 监测 到 要 求 的 响 铃 数量 后 应 答 。 我 们 将 监测 行为 分 解 为 等 待 维护 响 铃 Main- 
tainRingsToWait 和 响 铃 计数 CountRings 两 个 子 行为 ,如 图 4-7 所 示 。 声 明 一 个 信号 rings _ to 
_wait, 由 等 待 维护 响 铃 子 行为 写 人 ,而 由 响 铃 计数 子 行为 读 人 。 当 达到 要 求 的 啊 铃 计数 后 , 监 
测 行为 结束 。 因 此 从 响 铃 计数 到 监测 状态 的 结束 点 增加 一 条 TOC 弧 。 


\_-Arising(hangup) 


failing(machine_on) 
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监测 器 
signal ms we watt: ge 
function Determine Wait return integer is 
i (num mage > 0) and follsavem i’) and ( 


elsif (machine_on="1 ") then 
retum(4); 


1 
et 


等 待 维护 响 铃 


al <= DetermineRingsToWait, 
on tolisaver, machine_on; 





图 4-7 监测 器 行为 


监测 器 也 可 以 通过 顺序 语句 描述 为 一 个 单独 的 算法 ,系统 建 模 者 可 以 自由 选择 最 方便 和 
可 读 性 最 强 的 方式 来 描述 它 的 功能 。 

应 答 器 行为 :应 管 活动 的 功能 描述 如 下 :“ 一 旦 电话 机 应 答 线 路 呼叫 ,就 播放 通知 。 通 知 播 
放 完 毕 将 产生 蜂 鸣 ,同时 线路 上 的 信息 被 记录 下 来 直到 挂 断 或 者 超过 最 长 的 信息 记录 时 间 ,之 
后 电话 机 挂 断 并 继续 监测 响 铃 呼叫 。 如 果 在 播放 通知 的 过 程 中 监测 到 用 户 的 挂 断 , 电 话机 立 
即 挂 断 并 且 丰 记录 消息 。 如 果 按 键 音 1 被 监测 到 , 则 不 管 当前 正在 播放 通知 还 是 正在 录制 信 
息 ,电话 机 都 将 立即 进入 远程 操作 模式 。” 

我 们 将 应 签 器 分 解 为 四 个 子 行为 :播放 通知 PlayAnnouncement、 记 录 消 息 RecordMsg 、 挂 
Bf Hangup 和 远程 操作 RemoteOperation, 如 图 4-8a 所 示 。 只 要 没有 异常 发 生 ， 系统 将 顺序 执 
行 前 三 项 操作 ,转换 的 完成 使 用 TOC 弧 。 一 种 异常 的 情况 是 在 播放 通知 状态 下 发 生 挂 断 操 
作 。 在 这 种 情况 下 ,用 一 条 TI 绝 表 示 立 即 迁 移 。 在 记录 消息 的 过 程 中 发 生 挂 断 认为 是 一 种 
正常 情况 而 不 是 异常 。 另 一 种 异常 的 情况 是 在 播放 通知 和 记录 消息 的 过 程 中 出 现 0001 的 按 
键 顺序 ,这 种 情况 出 现 后 系统 将 从 播放 通知 和 记录 消息 的 状态 通过 TI 弧 立 即 迁 移 到 远程 操 
作 状 态 。 挂 断 状态 结 束 后 状态 将 迁移 进 和 应答 完 成 点 。 

播放 通知 行为 :通知 的 播放 包括 三 个 简单 步骤 ,可 以 表示 为 图 4-8b 所 示 的 三 个 顺序 语句 
描述 。 

记录 消息 行为 :记录 一 条 信息 非常 简单 ,用 顺序 语句 描述 的 步骤 如 图 4-8c 所 示 。 在 一 秘 
钟 的 蜂 鸣 结束 之 后 ,消息 被 记录 直到 发 生 挂 断 或 者 100 秒 超时 。 第 二 声 蜂 鸣 在 消息 结束 时 产 
生 , 同 时 消息 计数 增加 。 

注意 ,描述 中 说 明了 在 一 秒 钟 的 蜂 鸣 过 程 中 出 现 呼叫 者 挂 断 的 可 能 性 。 如 果 呼 叫 者 确实 
进行 了 挂 断 , 则 hangup 信号 为 ‘0' ,于 是 行为 结束 且 不 执行 记录 和 增加 消息 数 的 语句 。 

远程 操作 行为 :关于 远程 操作 的 描述 如 下 :远程 操作 的 第 一 步 是 检查 用 户 的 身份 号 码 
ID, 接 下 来 四 次 按键 序列 的 值 将 和 内 部 存储 的 值 进行 比较 。 如 果 二 者 不 匹配 ,电话 机 将 挂 断 
电话 ;否则 ,电话 机 进入 基本 命令 模式 ,该 模式 下 可 以 执行 几 种 基本 命令 。 
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rising(hangup) 





b) 播放 通知 的 描述 o 记录 消息 的 描述 


图 4-8 ”应 答 器 行为 


这 里 将 远程 操作 分 解 为 两 个 顺序 子 行为 : 号 码 检 查 CheckCode 和 命令 响应 Respond- 


ToCmds, 如 图 4-9a 所 示 。 在 检查 了 由 用 户 输入 的 表征 身份 的 四 位 数字 码 后 , 当 且 仅 当 号 码 匹 


配 进 人 命令 响应 状态 。 我 们 引入 一 个 布尔 值 信号 code _ ok, 号 码 检 查 状态 在 判断 输入 号 码 正 


确 后 会 将 该 信号 赋值 为 “true”。 这 里 将 引入 两 条 TOC 弧 , 一 条 从 号 码 检查 指向 用 户 命令 响 
应 ,状态 转换 的 条 件 是 code ok 的 值 为 “true”; 另 一 条 从 号 码 检 查 指向 远程 操作 的 完成 点 , 转 
换 发 生 的 条 件 为 code _ok 为 “false"。 如 果 在 号 码 检查 过 程 中 发 生 挂 断 , 则 通过 一 条 TI 弧 转换 
到 远程 操作 的 完成 点 。 


Ca 


| code_ok=‘0’ 





a) 子 行为 分 解 b) 号 码 检查 的 描述 
图 4-9 ”远程 操作 行为 


号 码 检 查 行为 ;代码 检查 的 行为 可 以 用 图 4-9b 来 描述 。 从 程序 可 以 看 出 ,如 果 连 续 四 次 
拨号 输入 值 和 存储 在 user _ code 中 的 数值 匹配 , 则 code _ ok 为 “true”, RWA “false” EA, R 
使 检测 到 不 匹配 的 值 ,算法 仍 将 继续 执行 直到 四 次 拨号 音 的 结束 。 该 过 程 防止 监测 到 错误 按 
键 时 的 立即 挂 断 ,电话 机 通知 一 个 非法 用 户 其 拨号 音 不 正确 。 


命令 响应 的 描述 方法 和 上 面 类 似 , 为 简便 起 见 此 处 不 再 丈 述 。 图 4-10 概述 了 分 解 后 控制 ， 
器 的 子 行为 和 状态 变迁 。 声 明和 叶 结 点 的 描述 在 这 里 省 略 ;关于 应 答 机 控制 器 的 完整 Spec- 


Charts 描述 请 参见 附录 B。 
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v '  tone="0010" 


hangup= 1 E 





图 4-10 MOLIS HAS AY FAST 


4.4 测试 用 例 举例 

为 了 用 模拟 的 方法 验证 控制 器 的 功能 ,我 们 生成 一 个 测试 用 例 。 一 个 测试 用 例 将 待 测 元 
件 实例 化 为 一 个 测试 模块 ,得 到 模拟 元 件 在 实际 工作 状态 下 的 输入 值 ,并 且 保 证 在 输出 端 得 到 
正确 的 预期 值 。 如 图 4-11 所 示 , 首 先 置 位 power 为 "二 ,接着 按 下 on/off 键 来 打开 电话 机 ,如 
果 操 作成 功 将 在 短 时 间 内 设置 on _off 为 '1'。 我 们 生成 四 次 响 铃 ,同时 保证 offhook 为 "1 , 判 
断 图 叫 是 否 被 应 答 。 如 果 呼 叫 没 有 得 到 应 答 ,模拟 过 程 会 打印 一 条 错误 信息 。 这 类 测试 用 例 
可 能 包含 几 和 于 行 代码 。 
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entity testbench_E is 
end entity; 
architecture testbench_A is 
begin 
component Controfler_E 
(tone : in bit_vector(0 to 3); 
hangup : in bit, 
ring: in 
end i ponent 
一 初始 化 组 件 ， 为 端 刀 加入 全 局 信号 
process 
rocedure PressButton(but: out bit) is 
n 


om it | 村 
wait for button_hold tme; 
but <= '0’; 


end; 


Bon Ring is 


fing = ring_hold time; 
or ring_hold_ time; 


tolisaver <= '0’; 

PressButton(on_off); 

一 加 入 一 个 呼叫 

Ring; Ring; Ring; Ring; 

wait for 

assert (offiook='1 ') report "ERROR1: did not answer’; 





图 4-11 应 答 机 测试 用 例 的 举例 


4.5 可 执行 系统 描述 的 优点 

在 检测 SpecCharts 和 其 基本 模型 PSM 的 描述 能 力 之 前 , 先 看 一 下 在 上 面 的 例子 中 ,相对 
于 自然 语言 而 言 , 几 可 执行 语言 来 描述 系统 的 优点 。 可 执行 语言 的 主要 优势 是 使 设计 结 米 减 
少 功能 性 错误 。 少 数 功 能 性 错误 的 出 现 的 原因 主要 在 于 :自然 语言 的 描述 虽然 易 读 ,但 是 这 种 
易 读 性 却 带 来 降低 精确 性 的 代价 。 可 读 性 较 好 的 自然 语言 描述 通常 由 一 连 串 的 情况 描述 组 
成 ,而 对 同样 功能 的 一 个 可 执行 描述 却 是 由 包含 处 理 上 述 情况 的 算法 组 成 。 例 如 ,下 面 是 一 段 
选 自前 面 小 节 内 容 的 自然 语言 描述 : 

“on/off" 按 键 用 于 将 电话 机 从 “ 开 ”状态 置 为 “ 关 " 状 态 ,或 者 相反 。 当 电话 机 处 于 “on 状 
态 ,一 般 在 四 声响 铃 之 后 应 答 。 然 而 ,如 有 果 “tollsaver 端口 处 于 on 并 且 至 少 记 录 了 一 条 信息 ， 
电话 机 将 在 响 铃 两 声 后 应 答 。 

上 述 最 后 两 句 话 的 每 一 句 都 描述 了 对 特定 情况 的 一 种 反应 。 假 设 我 们 的 初衷 是 明确 摘 述 
所 有 可 能 情况 下 的 行为 。 我 们 必须 加 入 以 下 这 些 撞 述 : 

在 铃声 计数 的 过 程 中 ,machine _on 或 者 tollsaver 可 能 改变 ,此 时 必须 重新 计算 电话 机 等 
待 所 需要 的 响 铃 数 , 并 且 继 续 记录 响 铃 数 直到 达到 该 数值 。 

如 果 我 们 试图 用 这 种 方式 明确 地 列举 出 所 有 可 能 的 情况 , 则 系统 的 自然 语言 描述 将 会 变 
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得 庞大 而 难 读 ,或 许 看 上 去 更 像 法 律 条 文 而 不 像 一 个 容易 理解 的 文档 。 为 了 更 加 精确 地 覆盖 
所 有 可 能 出 现 的 情况 ,我 们 应 当 将 一 段 描述 当 作 算法 来 看 ,比如 : 

首先 确定 需要 等 待 的 响 铃 数 , 接 下 来 重复 尺 下 过 程 直 到 检测 到 必需 的 响 铃 数 : 

我 们 等 待 响 铃 或 者 on _ off 或 tollsaver 信号 的 变化 。 如 果 监 测 到 响 铃 , 则 增加 当前 的 响 铃 
计数 。 如 果 on off 或 tollsaver 信号 变化 , 则 重新 判定 电话 机 等 待 需要 的 响 铃 计数 。 


这 样 的 描述 写 起 来 并 不 自然 有 昌 难 于 理解 。 

不 同 于 自然 语言 ,可 执行 语言 对 上 例 这 样 的 算法 描述 则 更 胜 一 筹 。 因 此 我 们 看 到 自然 语 
言 描述 和 可 执行 描述 一 般 用 于 不 同 目 的 且 互 为 补充 。 自 然 语 言 的 描述 偏重 强调 将 一 般 的 行为 
描述 为 一 系列 情况 , 留 下 太 多 需要 读者 推测 的 部 分 ,然而 可 执行 描述 对 行为 的 详尽 描述 不 会 留 
下 任何 解释 上 的 变化 空间 。 一 个 经 过 充分 证 明 的 可 执行 描述 可 服务 于 上 述 两 种 用 途 。 

通过 创建 可 执行 系统 描述 ,设计 者 必须 在 实现 一 个 系统 之 前 就 考虑 到 细节 的 功能 性 。 除 
此 之 外 ,在 获取 系统 描述 之 后 ,设计 者 可 在 脑海 中 构建 各 种 可 能 情况 并 且 判 断 功 能 是 否 止 确 。 
例如 :我 们 可 以 假设 如 下 问题 ;“ 当 五 次 铃 响 之 后 且 machine _ on 为 0 时 会 发 生 什 么 ?监测 模 
块 的 代码 可 以 精确 地 回答 该 问题 :呼叫 得 到 应 答 。 然 而 自然 语言 描述 就 不 能 直接 回答 这 样 的 
问题 。 

采用 可 执行 描述 的 另 一 个 好 处 是 可 以 用 模拟 的 方法 来 进一步 验证 系统 的 功能 。 所 有 这 些 
前 期 的 努力 都 将 极 大 降低 在 设计 后 续 阶 段 出 现 的 功能 性 错误 的 数量 ,这 同时 也 意味 着 耗 时 的 
设计 修改 次 数 将 减少 ,同时 大 大 降低 整个 系统 的 设计 周期 。 


4.6 ”PSM 模型 的 优势 


应 答 机 控制 器 的 例子 说 明 ,从 SpecCharts 语言 及 其 PSM 模型 ,如 3.3 PHRASE 
系统 的 六 个 特性 是 如 何 很 容易 就 得 到 的 。 
4.6.1 层次 性 

系统 采用 自 上 而 下 的 分 解 方式 。 例 如 ,在 最 高 层 系 统 被 认为 具有 两 个 行为 模型 ,系统 关 和 
系统 开 。 系 统 开 又 被 分 解 为 几 个 子 行为 。 由 于 人 们 习惯 一 级 一 级 地 思考 从 而 控制 复杂 度 , 自 
然 语言 描述 也 趋向 于 层次 性 。SpecCharts 本 身 对 层次 性 的 支持 使 得 可 以 将 目 然 语 言 的 概念 层 
次 描述 方便 地 映射 为 SpecCharts 的 结构 。 


4.6.2 状态 迁移 

多 数 系统 行为 都 是 顺序 的 ,从 一 个 行为 转 为 另 一 个 ,然而 状态 迁移 却 是 非 结 构 化 的 。 例 
如 ,应 答 行 为 包含 四 个 子 行为 和 六 个 彼此 直接 可 能 的 迁移 。 这 种 非 结 构 化 的 迁移 很 容易 映射 
为 SpecCharts 中 的 状态 迁移 结构 ,因为 从 任何 行为 都 可 以 直接 迁移 到 其 他 行为 。 这 种 迁移 用 
单独 的 顺序 语言 很 难 描述 ,就 像 大 多 数 程序 设计 语言 和 硬件 描述 语言 所 要 求 的 那样 。 用 顺序 
语言 来 描述 非 结 构 化 的 迁移 需要 用 到 goto 语句 ,但 是 为 了 保证 程序 的 可 读 性 和 模块 化 ,大 多 
数 语 言 不 支持 该 语句 。 
4.6.3 程序 设计 结构 | 

描述 某 种 行为 的 最 简单 方式 是 通过 算法 。 例 如 ,号 码 检查 行为 可 以 用 一 个 带 条 件 分 支 和 
循环 的 七 行 算法 来 描述 。 例 子 中 的 算法 由 一 系列 操作 写成 ,和 大 多 数 算法 类 似 , 因 而 可 以 很 容 
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易 地 映射 为 SpecCharts 中 的 顺序 程序 设计 结构 。 


4.6.4 并 行 性 

我 们 看 到 监测 器 行为 被 分 解 为 两 个 并 行 的 子 行为 ,维护 等 待 响 铃 (Maintain Rings Towait) 
和 响 铃 计数 (Count Rings)。 如 果 不 支 持 并 行 性 , 则 并 行 行为 将 不 得 不 顺序 描述 ,这 种 情况 下 ， 
行为 必须 足够 小 到 适合 顺序 描述 ,顺序 化 较 大 的 行为 通常 会 导致 非常 复杂 且 可 读 性 很 差 的 摘 
述 。 由 于 任何 行为 在 SpecCharts 的 任何 层次 上 都 可 被 分 解 为 顺序 或 并 发 结构 ,例子 中 的 并 发 
性 可 以 很 容易 地 映射 为 SpecCharts 中 一 个 并 发 分 解 行为 。 


4.6.5 异常 处 理 

在 各 个 层次 级 别 上 都 有 很 多 异常 情况 需要 处 理 。 一 次 挂 断 操作 需要 作为 特殊 情况 立即 处 
理 ,同时 涉及 远程 操作 .应 答 和 线路 响应 。 线 路 上 的 拨号 音 需 要 应 答 的 立即 处 理 。machine _ 
on 信和 号 的 改变 需要 线路 响应 的 立即 响应 。 电 话机 上 的 一 次 按键 也 需要 系统 开 状 态 的 立即 响 
应 。 最 后 ,power 信号 的 改变 也 需要 控制 器 的 立即 啊 应 。 

使 用 TI 绝 结 构 可 以 容易 地 处 理 异 常 。 任 何 时 候 都 会 发 生 很 多 可 能 的 异常 情况 ,因而 要 
在 这 些 异常 中 指定 优先 级 是 很 困难 的 。 然 而 ,层次 性 可 以 简化 对 优先 级 的 指定 。 如 果 同 时 发 
生 很 多 事件 , 则 SpecCharts 中 高 度 最 大 的 TI 强 具 有 优先 啊 应 权 。 


4.6.6 完成 

由 于 系统 采用 层次 式 的 分 解 , 在 很 多 情况 下 ,我 们 在 描述 一 个 子 行为 之 前 ,在 子 行为 之 间 
建立 基于 子 行为 完成 的 迁移 。 例 如 ,在 线路 响应 状态 ,我 们 在 监测 器 完成 时 建立 从 监测 天 到 应 
答 器 的 迁移 。 在 后 面 将 会 看 到 ,监测 器 行为 可 以 被 描述 为 一 系列 顺序 语句 或 者 一 组 并 行 的 子 
行为 。 定 义 监测 器 的 完成 来 简化 层次 分 解 的 复杂 性 ,而 不 管 监测 器 被 指定 为 顺序 描述 还 是 一 
组 子 行为 。 
4.6.7 状态 分 解 和 编码 的 等 价 性 

如 前 所 述 , 一 个 行为 可 以 被 描述 为 子 行为 或 者 程序 代码 。 从 层次 化 的 角度 来 看 ,这 两 种 方 
法 在 功能 上 是 等 价 的 。 系 统 建 模 者 可 以 自由 选用 可 能 的 最 好 方式 。 在 例子 中 ,我 们 既 可 将 按 
键 响 应 和 监测 器 描述 为 程序 ,也 可 以 描述 为 顺序 或 者 并 发 的 子 行 为 。 利 用 这 些 丰 富 而 灵活 的 
选择 ,编写 一 个 好 的 系统 描述 ,除了 科学 性 也 同样 要 有 技巧 性 ,类 似 于 软件 工程 。 


4.7 实验 


从 上 面 的 例子 可 以 得 到 利用 SpecCharts 来 得 到 能 人 式 系统 描述 优势 的 直观 感受 。 没 有 
它 , 得 到 系统 描述 的 时 间 将 增加 ,对 系统 功能 性 的 理解 将 会 减少 ,同时 功能 性 错误 的 发 生 可 能 
更 多 。 我 们 将 用 几 个 实验 来 定量 地 进行 说 明 。 实 验 将 对 采用 SpecCharts 和 VHDL 语言 得 到 
能 和 人 式 系统 的 描述 进行 比较 。 


4.7.1 系统 描述 的 获取 比较 
这 个 实验 的 目的 是 说 明 利用 SpecCharts 描述 需求 时 , 对 获取 时 间 和 描述 错误 的 减少 。 将 
建 模 者 分 两 组 ,对 象 是 同一 个 实例 系统 的 自然 语言 描述 。 两 个 小 组 分 别 使 用 VHDL 和 Spec- 
Charts 进行 描述 。 下 面 对 两 个 小 组 的 描述 过 程 所 花费 的 时 间 和 描述 错误 的 数量 进行 比较 。 
实例 系统 是 一 个 空中 交通 报警 和 防 碰 撞 系 统 [LHHR92]。 之 所 以 选择 该 系统 ,一 方面 它 
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代表 一 个 现成 的 其 人 式 系统 , 另 一 方面 它 的 文档 可 以 从 外 界 渠 道 获得 ,于 是 降低 了 实验 不 公平 
的 可 能 性 。 由 于 时 间 限 制 ,只 从 系统 功能 中 抽取 了 一 部 分 进行 系统 描述 。 三 名 建 模 者 使 用 
VHDL ,另外 三 名 使 用 SpecCharts。 

图 4-12 所 示 是 两 组 建 模 者 系统 描述 获取 的 结果 比较 。VHDL 小 组 的 建 模 时 间 是 另 一 组 
的 平均 2.5 倍 。 此 外 ,两 个 VHDL 的 规格 描述 中 都 存在 一 个 重大 的 控制 错误 ,该 错误 导致 系 
统 对 外 部 事件 的 响应 严重 变 慢 。 这 个 错误 给 VHDL 小 组 的 建 模 者 指出 后 ,他们 又 试图 修正 他 
们 的 系统 描述 ,结果 在 指定 的 时 间 内 只 有 一 名 建 模 者 修正 了 该 错误 。SpecCharts 由 于 支持 状 
态 迁 移 和 异常 处 理 , 被 证 明 更 加 有 效 。 

VHDL SpecCharts 


平均 描述 时 间 ( 分 ) 
建 模 者 数量 
第 一 次 不 正确 描述 的 数量 


第 二 次 不 正确 描述 的 数量 





图 4-12 系统 描述 获取 的 统计 


4.7.2 系统 描述 的 理解 比较 

这 个 实验 的 目的 在 于 说 明 SpecCharts 系统 描述 在 易 理解 性 方面 相 比 VHDL 系统 摘 述 的 
优势 。 给 予 一 个 小 组 的 建 模 者 一 个 系统 的 VHDL 描述 ,给 予 另 一 个 小 组 SpecCharts 描述 ;每 
个 小 组 都 将 回答 几 个 关于 系统 功能 的 问题 。 接 下 来 将 比较 回答 正确 的 个 数 和 每 个 小 组 对 系统 
功能 理解 的 时 间 。 

选取 的 样 例 是 一 个 以 太 网 协 处 理 器 (ethernet coprocessor)[GD92 ] 的 一 部 分 ,该 例 的 HDL 
系统 描述 可 以 从 外 界 渠 道 获得 。 我 们 手工 创建 了 一 个 与 之 功能 等 价 的 SpecCharts 描述 ,并 将 
VHDL 和 SpecCharts 描述 分 别 给 予 三 名 建 模 者 。 每 个 人 理解 系统 描述 的 时 间 都 记录 下 来 。 
在 理解 之 后 ,每 个 人 都 回答 十 四 个 关于 系统 的 问题 ,比如 “ 当 使 能 信号 跳 变 为 低位 后 将 发 生 什 
么 ?”“ 任 何 输 入 数据 将 发 送 多 少 个 前 导 字 节 ?”“ 变 量 v 的 用 途 是 什么 ?” 

VHDL 系统 描述 小 组 的 建 模 者 对 一 般 行为 的 理解 时 间 是 平均 时 间 的 三 倍 。 些 外, 他们 平 
均 有 两 个 错误 回答 ,然而 使 用 SpecCharts 的 小 组 正确 回答 了 所 有 的 问题 。 


4.7.3 系统 描述 的 量化 比较 

为 了 量化 SpecCharts, VHDL 和 Statecharts 规格 描述 之 间 的 差异 ,本 实验 将 一 个 系统 分 别 
用 三 种 语言 描述 ,接着 分 别 比较 了 规格 描述 的 儿 个 不 同方 面 。 

样 例 选择 的 是 本 章 描 述 的 电话 应 答 机 。 分 别 用 SpecCharts, VHDL 和 Statecharts 从 自然 
语言 描述 中 获取 系统 描述 。 创 建 了 两 个 VHDL 的 版 本 ,其 中 一 个 版 本 利用 艇 套 模块 和 通过 控 
制 信号 的 进程 通信 来 维护 层次 性 ,将 在 5.6 节 描 述 ; 另 一 个 版 本 将 层次 结构 展开 为 平面 的 程序 
状态 机 ,接着 描述 为 一 个 单独 的 进程 。 

图 4-13 所 示 是 实验 的 结果 ,平面 VHDL 描述 的 程序 状态 数 较 少 ,只 存在 叶子 程序 状态 ， 
然而 换 来 的 代价 是 4 售 左右 的 获取 时 间 和 连接 绝 数 量 的 增加 。 原 因 如 下 :在 层次 化 的 模型 中 ， 
一 条 位 于 高 层 的 弧 可 以 明确 表示 :一 条 连接 弧 条 件 为 真 要 求 从 一 个 状态 迁移 到 男 一 状态 ,而 并 
不 关心 系统 当前 所 处 的 叶子 状态 。 在 平面 模型 中 ,这 样 的 一 条 弧 必 须 把 每 一 个 叶子 状态 被 显 


式 地 复制 为 正确 的 次 态 。 对 于 立即 迁移 ,类 似 前 面 所 述 , 还 需要 在 整个 代码 中 重复 。 更 进 一 
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步 , 弧 是 用 顺序 描述 来 表述 的 。 以 上 这 三 点 原因 导致 平面 VHDL 描述 的 文字 量 大 约 是 Spec- 


Charts 的 4 们 左右 。 


4 VHDL VHDL 
模型 SpecCharts (分 级 ) ( 平 铺 ) Statecharts 


无 状态 迁移 结构 





图 4-13 SpecCharts, VHDL 和 Statecharts 的 比较 


层次 化 的 VHDL 描述 不 需要 任何 附加 的 程序 状态 或 弧 ,但 需要 增加 84 个 控制 信号 ,每 个 
程序 状态 两 个 信号 ,用 于 在 多 个 进程 中 控制 。 读 写 这 些 信号 ,加 上 对 立即 迁移 的 重复 和 弧 的 顺 
序 语句 表示 ,也 导致 四 倍 SpecCharts 的 文字 数量 。 很 明显 ,描述 的 行 和 文字 数量 越 多 , 系统 描 
述 的 获取 时 间 、 理 解 时 间 和 错误 的 出 现 都 会 增加 。 只 考虑 叶子 程序 状态 ,两 种 VHDL 描述 版 
本 对 每 个 叶 状 态 的 描述 都 需要 SpecCharts 四 倍 左右 的 描述 量 。 这 种 增加 降低 了 叶子 状态 的 可 
读 性 ,也 与 用 叶 结 点 来 使 程序 功能 模块 化 和 便于 理解 的 初 囊 背道而驰 了 。 

Statecharts 缺少 程序 设计 结构 的 后 果 在 这 个 例子 中 也 清晰 可 见 。 由 于 叶 行 为 的 程序 设计 
结构 必须 用 状态 和 弧 来 描述 ,Statecharts 的 描述 包含 了 相当 于 SpecCharts 描述 的 两 倍 的 状态 
数 和 三 倍 的 弧 数 。 比 起 利用 顺序 程序 设计 结构 而 言 , 用 状态 和 弧 来 描述 程序 设计 结构 是 非 闸 
单调 和 不 自然 的 。 例 如 ,一 个 简单 的 for loop 就 必须 使 用 多 个 状态 和 弧 来 描述 。 注 意 ,由 于 
Statecharts 只 是 图 形 化 的 定义 ,没有 定义 行 和 文字 。 


4.7.4 设计 质量 比较 

本 实验 的 目的 是 说 明 利用 SpecCharts 设计 的 质量 并 不 低 于 从 自然 语言 描述 中 产生 的 设 
计 。 我 们 将 比较 从 自然 语言 系统 描述 中 生成 的 设计 和 从 SpecCharts RARER RTT AY i 
体 管 数量 差别 。 

实例 的 选择 还 是 本 章 介 绍 的 应 答 机 。 将 一 个 自然 语言 的 描述 分 发 给 两 位 设计 者 ,其 中 一 
位 从 描述 中 直接 生成 控制 器 和 数据 通路 ; 另 一 位 设计 者 首先 利用 SpecCharts 获取 系统 描述 , 继 
而 进行 自动 层次 展开 ,接着 从 展开 后 的 SpecCharts 描述 中 生成 数据 通路 和 控制 器 。 以 上 两 种 
情况 ,都 采用 UC Berkeley 的 KISS 工具 将 控制 器 的 有 限 状 态 机 FSM 描述 综合 为 逻辑 电路 。 

”设计 的 结果 如 图 4-14 所 示 。 每 个 人 的 设计 时 间 几 乎 一 样 ,都 是 30 小 时 。 注 意 从 Spec- 

Charts 描述 中 得 到 的 最 终 设 计 的 晶体 管 数量 并 不 多 于 从 自然 语言 描述 中 得 到 的 数量 。 事 实 
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上 ,用 SpecCharts 得 到 的 晶体 管 数量 更 少 ,因为 设计 中 用 到 的 控制 状态 较 少 。 状 态 减 少 的 原因 
如 下 ,采用 自然 语言 系统 描述 的 设计 者 用 有 限 状态 机 FSM 来 获取 功能 ,FSM 是 描述 系统 功能 
唯一 精确 的 模型 。 为 了 在 脑海 中 验证 电话 机 功能 的 正确 性 ,设计 者 必须 维护 FSM 的 可 读 性 。 
这 种 可 读 性 的 要 求 将 阻碍 设计 者 将 多 个 可 能 的 状态 合并 为 一 个 状态 ,因为 这 种 合并 会 提高 心 
算 验 证 的 难度 。 另 一 方面 ,SpecCharts 的 设计 者 利用 SpecCharts 描述 进行 功能 验证 。 当 转换 
为 FSM 以 后 ,FSM 的 可 读 性 是 不 用 考虑 的 。 这 个 转换 的 过 程 中 进行 了 状态 的 合并 ,因而 会 得 
到 较 小 的 控制 逻辑 。 


语言 SpecCharts 
设计 特性 "Baas “asia 
控制 晶体 管 数 3130 2630 
数据 通路 品 体 管 数 2277 2251 
总 晶体 管 数 5407 4881 
总 引 脚 数 38 38 


图 4-14 ”设计 质量 的 比较 


采用 可 执行 的 系统 描述 比 利 用 自然 语言 来 获取 系统 功能 的 描述 有 更 多 的 优点 。 它 使 得 设 
计 者 在 设计 流程 的 早期 就 明确 地 考虑 尽量 精确 的 功能 细节 ,此 时 对 细节 的 更 改 是 比较 容易 的 。 
可 执行 的 系统 描述 可 以 利用 模拟 器 进行 验证 ,也 可 以 交 由 综合 工具 来 自动 设计 。 系 统 描述 也 
可 作为 良好 的 文档 供 将 来 使 用 。 这 些 优点 可 以 导致 更 短 的 设计 时 间 和 更 快 的 上 市 日 期 。 

为 了 创建 系统 功能 的 可 执行 系统 描述 ,设计 者 必须 首先 建立 能 够 非常 精确 且 可 以 理解 的 
用 于 组 织 系统 的 概念 模型 ,必须 选择 一 个 支持 获取 该 模型 的 语言 。 这 一 章 说 明了 PSM 模型 和 
SpecCharts 语言 在 获取 舱 入 式 系 统 的 功能 描述 方面 的 适用 性 。 

系统 设计 的 可 执行 描述 和 软件 设计 中 的 结构 化 程序 设计 语言 ,二 者 的 角色 有 着 很 强 的 相 
似 性 。 最 早 ,软件 是 在 汇编 语言 基础 上 开发 的 。 随 着 程序 复杂 度 的 提高 ,开发 的 重点 开始 向 具 
有 更 高 抽象 性 的 结构 化 程序 设计 语言 的 层次 上 转移 ,例如 C 语言 。 这 种 语言 更 容易 让 人 理 
解 ,从 而 能 够 减少 功能 设计 的 错误 ,加 快 开 发 的 时 间 。 在 系统 设计 方面 ,以 前 的 设计 重点 在 
FSM 和 数据 通路 组 件 的 层次 上 。 当 前 ,重点 已 经 转移 到 可 执行 描述 语言 如 VHDL 和 Verilog 
上 ,同样 是 因为 这 种 语言 可 以 极 大 地 提高 人 对 复杂 系统 的 理解 。 在 软件 方面 ,高 级 语言 又 演化 
到 处 理 新 的 概念 模型 的 层次 ,例如 C++ 支持 面向 对 象 的 模型 。 在 系统 设计 方面 ,高 级 语言 
将 继续 发 展 , 如 支持 PSM 模型 的 SpecCharts。 


4.9 练习 


1. 将 图 4-9b 中 的 号 码 检查 用 有 限 状态 机 重 写 。 该 版 本 是 否 更 容易 理解 呢 ? 

2. 假设 当前 的 应 答 机 行为 是 图 4-8c 中 指定 的 记录 消息 , 且 tape _ rec = °1’. {RUE power 变 
为 '0’ ;如 何 能 使 tape _ rec 变 回 '0’ 来 中 断 消息 的 录制 过 程 ? (提示 :参考 附录 B 的 系统 关 
行为 ) 

3. 用 Statecharts 来 描述 监测 需 行 为 。 

4. FA VHDL, SpecCharts 和 Statecharts 分 别 描述 一 个 具有 取 指 令 和 执行 功能 的 简单 CPU 的 描 
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述 ,指令 可 以 自己 选择 。 修 改 上 述 每 个 设计 ,使 得 系统 可 以 异步 重启 。 
5. 叙述 系统 功能 描述 和 它 的 结构 实现 之 间 的 主要 区 别 。 它 们 各 自 的 有 用 方面 是 哪些 ? 
“6. 用 SpecCharts 来 描述 一 个 不 同 于 本 章 所 介绍 的 商用 应 答 机 的 功能 。 将 该 功能 描述 和 自然 
语言 的 功能 描述 进行 比较 。 
“7. 用 SpecCharts 和 Statecharts 来 描述 一 个 交通 灯 控 制 髓 。 
“8. 可 执行 描述 和 结构 化 的 实现 都 可 以 通过 模拟 来 验证 功能 的 正确 性 。 设 计 一 种 技术 来 比较 
各 自 模 拟 的 输出 ,要 求 该 方法 能 够 保证 同样 的 输入 集 可 以 得 到 同样 的 输出 ,即使 每 次 输出 
的 时 间 不 同 。 
“9. 设计 一 种 方法 将 自然 语言 的 功能 描述 转换 为 一 种 可 执行 的 系统 描述 。 
“10. 开发 一 个 自然 语言 的 子 集 , 使 得 对 功能 规格 的 书写 可 以 用 精确 但 是 较为 自然 可 读 的 方 
式 进 行 。 

“11. 高 层次 综合 的 任务 是 将 可 执行 的 系统 描述 转换 为 寄存 器 传输 结构 。 然 而 ,编写 可 执行 
的 系统 描述 通常 只 是 为 了 方便 可 读 性 ,并 不 一 定 用 于 综合 。 氢 述 一 干 可 读 性 和 可 综合 
性 的 系统 描述 之 间 的 不 同 ,并 且 在 二 者 之 间 定 义 一 套用 于 转换 的 规则 。 








第 5 章 转换 成 VHDL 


在 前 面 的 两 章 中 ,讨论 了 能 最 好 地 支持 给 定 系 统 模型 的 系统 描述 语言 所 带 来 的 优势 。 不 
幸 的 是 ,最 好 的 语言 并 不 总 是 具有 最 好 的 支持 工具 。 在 本 章 将 说 明 如 何 通过 将 想 要 的 语言 转 
换 成 另 一 种 具备 好 的 支持 工具 的 语言 来 解决 这 个 问题 。 


5.1 引言 


使 用 可 执行 语言 去 描述 系统 所 期 望 的 功能 意欲 达到 几 个 目标 。 首 先 ,这 种 语言 可 以 作为 
系统 概念 设计 (conceptualizing) 的 媒介 , 它 提 供 了 一 种 具体 实现 形式 ,可 以 被 多 个 人 不 断 修正 
和 细 化 ,直至 完成 ,从 而 使 定义 系统 所 期 望 功能 的 实际 智能 过 程 更 加 简便 。 其 次 , 当 把 系统 功 
能 用 语言 表达 出 来 后 ,我 们 就 能 得 到 具体 的 系统 描述 。 从 这 种 意义 上 说 ,使 用 可 执行 语言 进行 
的 系统 描述 提供 了 一 个 可 以 在 今后 重复 调用 的 文档 。 最 后 ,可 执行 语言 可 以 作为 各 个 工具 的 
输入 ,例如 模拟 .调试 .综合 和 验证 工具 。 一 种 理想 的 语言 应 该 同时 实现 上 面 3 个 目标 ,虽然 通 


常情 况 下 并 非 如 此 。 举 个 例子 来 说 ,第 3 个 目标 用 标准 语言 可 以 很 好 地 实现 ,因为 标准 语言 本 


身 就 具有 很 多 的 工具 。 然 而 前 两 个 目标 ,只 有 文 持 简明 地 组 织 给 定 系 统 功能 的 概念 模型 (con- 
ceptual model) 的 语言 才能 实现 , 详 见 第 3 章 。 

假设 一 个 建 模 者 已 经 为 给 定 系 统 选 定 了 合适 的 概念 模型 。 理 想 情 况 是 ,使 用 支持 这 一 模 
型 的 标准 语言 来 构造 系统 模型 。 不 幸 的 是 ,通常 并 不 存在 一 种 标准 语言 可 以 完全 支持 所 选 概 
念 模型 的 每 个 特性 。 例 如 ,程序 状态 机 (program-state machine) 可 以 说 是 其 人 式 系 统 最 好 的 概 
念 模型 ,但 是 大 多 数 标准 语言 (例如 VHDL) 支 持 的 是 并 发 任务 模型 。 系 统 建 模 者 不 可 能 等 待 
针对 他 提出 的 概念 模型 开发 出 一 种 新 的 标准 语言 来 ,所 以 这 种 情况 要 求 他 采用 下 面 3 种 选择 
中 的 一 种 。 

1) 标准 语言 (standard language) :这 是 应 用 中 最 常见 的 选择 。 当 使 用 一 种 已 有 的 标准 语 
言 时 ,必须 要 克服 它 的 不 足 ,对 于 每 个 不 能 被 支持 的 特性 ,利用 该 标准 语言 中 可 用 的 结构 进行 
复杂 的 组 合 来 描述 概念 化 模型 。 这 个 方法 有 若干 优点 :首先 ,尽管 该 语言 不 能 完全 支持 所 选 模 
型 ,但 是 可 以 扩展 该 语言 已 有 的 工具 基础 ,从 而 使 得 模型 容易 被 组 合成 一 个 全 新 的 或 者 已 有 的 
框架 。 同 时 ,学 习 语 言 本 身 非常 容易 ,因为 它 已 经 为 人 熟知 了 ,或 者 有 容易 阅读 的 文档 。 由 于 
同样 的 原因 ,学 习 这 个 工具 也 很 容易 。 另 外 ,不 需要 实现 新 的 工具 ,已 有 工具 就 有 很 好 的 效率 。 
这 个 方法 也 有 它 的 缺点 ,最 主要 的 缺点 是 要 把 不 能 被 支持 的 概念 化 模型 特性 强制 转换 成 已 有 
的 语言 结构 。 这 样 模型 就 只 能 被 隐 式 描述 ,结果 使 得 系统 描述 难以 阅读 和 理解 ,因而 降低 概念 
化 的 有 效 性 ,也 降低 文档 的 可 读 性 。 从 这 个 意义 上 讲 , 选 择 标准 语言 与 使 用 正式 语言 的 3 个 目 
标的 前 两 个 相 矛 盾 。 | | | 

2) 专用 语言 (application-specific language) :在 这 个 方法 中 ,选择 与 所 需要 的 概念 化 模型 
直接 对 应 的 语言 ,即便 这 种 语言 可 能 缺乏 大 量 的 支持 工具 和 专门 技术 。 我 们 称 这 种 语言 为 专 
用 语言 。 这 种 方法 的 优点 是 可 以 保证 模型 和 语言 之 间 有 很 好 的 匹配 ,从 而 实现 使 用 可 执行 语 
言 的 前 两 个 目标 ,对 概念 化 和 文档 有 所 帮助 。 这 种 方法 也 存在 缺点 ,就 是 新 的 工具 知 要 实现 和 
学 习 。 更 进一步 ,这 些 新 工具 与 已 有 工具 结合 ,可 能 不 是 非常 有 效 和 可 靠 。 最 后 ,学习 这 种 语 
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言 要 花费 时 间 , 特 别 是 如 果 没 有 可 用 的 好 的 文档 。 

3) 前 端 语 言 (front-end language) :这 种 方法 基本 上 是 结合 了 上 面 两 种 方法 的 优点 。 前 端 
语言 用 于 可 以 转换 成 标准 语言 的 特殊 概念 化 模型 。 在 这 个 过 程 中 ,可 以 选择 与 需要 的 概念 化 
模型 相 匹配 的 语言 ,使 语言 满足 概念 化 和 文档 的 目的 。 然 后 再 将 其 转换 成 标准 语言 ,从 而 利用 
已 有 工具 。 这 个 方法 需要 实现 一 个 转换 器 ,但 仍旧 比 实现 专用 语言 所 需 的 模拟 或 综合 工具 简 
单 得 多 。 这 种 方法 最 主要 的 缺点 是 往往 需要 学 习 这 个 前 端 语 言 。 如 果 前 端 语 言 是 由 标准 语言 
扩展 而 来 ,学 习 的 时 间 可 以 缩短 。 例 如 ,SpecCharts 是 VHDL 的 扩展 ,这 意味 着 熟悉 VHDL 的 
人 只 需要 几 小 时 就 能 学 会 SpecCharts。 图 5-1 举例 说 明 在 VHDL 环境 下 SpecCharts 如 何 作为 
前 端 语言 使 用 。 

从 更 一 般 的 层面 上 看 ,上 面 的 讨论 说 明 VHDL SpecCharts 
在 实际 的 系统 描述 和 设计 环境 中 语言 转换 的 


重要 性 。 更 明确 地 ,可 以 看 出 语言 转换 中 的 转换 器 
关键 问题 在 于 模型 转换 。 模 型 转换 就 是 将 系 voL 
统 的 一 种 概念 化 模型 转换 成 另 一 种 模型 。 举 

例 来 说 ,如 果 想 把 一 个 用 KISS 语言 描述 的 有 A VHDL 环境 


模拟 器 调试 器 测试 生成 器 


限 状态 机 (Finite state machine，FSM) 转 换 成 
用 C 语 言 描述 ,必须 先 把 FSM 模型 转换 成 顺 
序 程序 模型 (sequential program model); 这 个 工具 输出 
转换 同 KISS 和 C 语言 的 结构 无 大 关联 。 男 。” 图 5-1 VHDL 环境 中 SpecCharts 作为 前 端 语言 
一 个 例子 是 把 用 C 语言 描述 的 FSM 转换 成 
用 SpecCharts 描述 。 如 果 仅 仅 执行 语言 转换 ,将 每 个 C 语言 结构 转换 成 相 一 致 的 SpecCharts 
结构 ,SpecCharts 的 结果 描述 只 是 一 个 类 似 于 C 程序 的 顺序 程序 。 如 果 用 模型 转换 代替 的 话 ， 
首先 从 C 语言 中 提炼 出 FSM 模型 ,再 把 FSM 转换 成 程序 状态 机 (Program-State Machine， 
PSM). SpecCharts 的 结果 描述 是 由 一 系列 行为 (状态 ) 和 弧 线 组 成 ,不 管 是 人 工 还 是 工具 都 比 
顺序 程序 更 容易 从 中 辨认 出 状态 迁移 的 性 质 。 

需要 注意 的 是 ,如 果 用 不 支持 所 需 模 型 的 标准 语言 进行 系统 描述 ,模型 转换 技术 通常 必须 
手动 实现 。 例 如 ,如 果 必 须 使 用 C 语言 描述 FSM , 则 不 得 不 将 FSM 手动 转换 成 顺序 程序 。 

确定 转换 技术 时 有 几 个 问题 必须 考虑 。 第 一 ,必须 保证 输入 输出 的 描述 在 功能 上 等 价 。 
第 二 ,输出 应 该 是 可 读 的 且 与 输入 相关 。 这 两 个 性 质 很 重要 ,因为 可 能 需要 测试 在 应 用 其 他 工 
具 时 的 输出 ,也 因为 很 多 公司 需要 标准 语言 描述 的 设计 文档 。 第 三 ,必须 保证 输出 描述 在 模拟 
时 的 效率 。 第 四 ,输出 要 服从 于 综合 的 需要 。 

本 章 的 其 余部 分 要 讨论 将 某 一 模型 的 特征 转换 成 另 一 模型 的 常用 技术 。 当 然 , 全 部 说 起 
来 ,有 非常 多 的 特征 和 模型 的 组 合 ,所 以 只 关注 将 常见 特征 转换 成 并 发 任务 模型 (concurrent- 
tasks model) 的 技术 。 选 择 并 发 任务 模型 作为 目标 模型 是 因为 这 种 模型 可 以 被 正 EF 标准 语言 
VHDL 支持 ,同时 被 另 一 种 通常 使 用 的 标准 语言 Verilog 支持 。 首 先 讨论 将 个 别 特 征 转 换 成 并 
发 任务 模型 ,然后 讨论 如 何 将 程序 状态 机 转换 成 并 发 任务 模型 。 


5.2 状态 迁移 
状态 迁移 允许 将 功能 分 解 成 一 组 由 绝 线 连接 的 模式 ,在 3.2.2 节 中 已 讨论 。 状 态 迁 移 遂 
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常 被 映像 为 单 任务 的 顺序 描述 [DCH91, AWC90，Hal93], 因 此 对 状态 图 的 转换 包括 构造 一 个 
状态 变量 ,每 个 状态 动作 的 一 个 语句 块 ,以 及 执行 相应 语 蚀 块 的 一 系列 分 文 。 下 面 举例 说 明 转 
换 方法 。 

图 5-2a 表示 状态 P.Q.R 之 间 的 一 组 状态 迁移 。 这 些 迁 移 可 以 转换 为 等 价 的 一 组 顺序 
语句 ,如 图 5-2b 所 示 。 在 转换 过 程 中 ,状态 用 一 个 变量 表示 , 它 有 三 个 可 取 值 :P、Q RR, 9 
始 值 为 已 ;构造 一 个 无 限 循环 来 描述 状态 间 的 无 穷 迁 移 ;在 循环 中 ,加 入 了 一 个 case 语句 ,由 
当前 状态 值 决定 执行 P.Q 或 R; 后 面 跟 由 语句 描述 的 动作 ,依照 绝 线 上 的 条 件 ,从 当前 状态 
迁移 到 下 一 个 适当 的 状态 。 


state_type is (P, Q, R); 
Wet Pe tyne 2 P; 


Pase (state) is 





a) 原始 状态 机 b) VHDI 顺序 语句 
图 5-2 ”状态 机 转换 

为 了 分 析 状 态 迁 移 是 如 何 用 语句 描述 的 ,我 们 来 看 执行 过 程 ;初始 状态 下 ,状态 值 为 P; 
执行 与 P 的 动作 相对 应 的 第 一 个 case 分 支 ; 接 下 来 检查 弧 线 上 的 条 件 u ,如 果 u 为 真 ,状态 转 
换 为 Q; 反 之 ,状态 转换 为 R; 于 是 到 达 case 语句 末尾 ,然后 回 到 循环 的 开始 ; 如 果 状 态 值 为 
Q , 则 执行 与 Q 的 动作 相对 应 的 第 二 个 case 语句 分 支 ,这 时 状态 又 变 成 己 , 然 后 重复 整个 过 
程 。 

上 述 的 转换 技术 适用 于 单 状 态 机 。 然 而 ,概念 化 模型 通常 描述 为 并 行 执行 的 通信 状态 机 
(communicating state-machine)。 可 以 很 容易 地 对 这 些 通信 状态 机 进行 操作 ,把 每 个 状态 机 映 
像 到 它 自 己 的 任务 之 上 ,并 且 通 过 全 局 变量 进行 通信 (例如 VHDL 中 的 信号 )。 

其 他 的 概念 化 模型 描述 层次 化 状态 机 (hierarchical state-machine) ,可 以 使 用 多 种 方法 进行 
转换 。 例 如 ,一 种 技术 是 将 层次 化 状态 机 转换 成 顺序 语句 ,保留 原 有 层次 ; 而 另 一 种 技术 则 将 
层次 平面 化 。 前 一 种 技术 , 即 层次 保留 技术 ,采用 下 述 的 方法 来 修改 上 面 介绍 的 描述 转换 技 
术 。 回 顾 前 面 所 讲 的 ,是 用 case 语 的 一 个 分 支 表 示 状 态 的 动作 。 然 而 在 层次 化 状态 机 中 ,这 
个 分 支 可 以 描述 为 另 一 个 状态 机 ,包括 新 的 状态 变量 、 循 环 和 case 语句 。 考 虑 图 5-3a 与 图 5- 
2a 是 相同 的 ,但 P 现在 是 包括 另 一 个 状态 机 的 层次 化 状态 。 顺 序 语句 描述 的 转换 也 与 前 面 在 
图 5-2b 中 所 示 的 那样 ,所 不 同 的 是 :P 的 动作 由 执行 另 一 个 状态 机 的 过 程 呼叫 所 取代 。 图 5- 
3b 表示 出 了 执行 P 的 过 程 : 当 控制 流 到 达 P 的 完成 点 时 ,过程 返回 ,说 明 图 5-2b 中 P 的 行为 
已 经 完成 。 
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a) 原始 层次 化 状态 机 b) 层次 化 状态 P 的 过 程 
图 5-3 层次 保留 状态 机 转换 | 


另 一 种 方法 ,在 层次 平面 化 技术 中 ,层次 化 状态 机 平面 化 ,只 剩 下 叶子 状态 。 然 后 把 平面 
化 的 状态 机 转换 成 如 图 5-2 中 所 示 的 顺序 语句 描述 。 例 如 ,可 以 将 图 5-3a 中 的 状态 机 平面 化 ， 
成 为 图 5-4a 所 示 的 新 状态 机 。 然 后 就 能 将 其 转换 成 图 5-4b 中 的 语句 描述 。 

这 几 种 技术 各 有 优势 。 层 次 保留 技术 的 优点 是 可 以 很 容易 地 将 顺序 语句 描述 同 原来 的 
RAL MDB ABE, AMAA RE. AWM, MUO RARE 
点 在 于 根据 顺序 语句 综合 所 得 到 的 硬件 更 加 简单 。 


ee ORS. T); 





a) 平面 化 的 状态 机 b) VHDL 顺序 语句 
图 5-4 层次 平面 化 的 状态 机 转换 


5.3 消息 传递 通信 

使 用 消息 传递 结构 (message-passing construct) 是 为 了 保证 并 发 行为 间 的 通信 的 抽象 且 容 
易 理 解 ,在 3.2.6 节 中 已 经 讨论 过 。 在 消息 传递 通信 中 ,数据 通过 抽象 的 通信 通道 发 送 和 接 
收 。 这 种 消息 传递 结构 可 以 映像 到 没有 这 种 结构 的 语言 上 ,例如 VHDL, 用 共享 变量 来 代替 通 
道 ,而 通过 这 些 变 量 传递 数据 的 显 式 动 作 来 实现 “发 送 ” 和 “接收 ”。 | 
5.3.1 阻塞 式 消息 传递 

在 阻塞 式 消息 传递 (blocking message passing) 中 ,消息 发 送 器 必须 等 到 消息 被 接收 后 才能 
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继续 工作 。 在 图 5-5a 中 的 例子 说 明了 这 种 消息 传递 的 转换 。 通 道 chan 用 于 传递 整 型 数据 。 
进程 P1 通过 这 个 通道 由 变量 mg 发 送 整 型 数据 ,进程 P2 接收 这 些 数据 到 变量 m。 图 5-5b E? 
为 转换 后 的 语句 描述 。 用 全 局 变量 即 VHDL 中 的 信号 来 代替 chan 的 声名 ,并 且 添 加 了 两 个 

新 的 全 局 信号 :chan _reg ,用 来 说 明 chan 中 有 可 用 消息 ;chan _ack ,用 来 说 明 chan 中 的 消息 
已 经 被 读 出 。 同 样 地 ,用 对 chan 的 写 操作 和 对 chan _ req 的 赋值 来 代替 P1 中 的 发 送 操作 。 
最 后 ,用 等 待 chan _req 被 赋值 和 对 chan 的 读 操作 代替 P2 中 的 接收 操作 。 这 样 , PI 通过 写 

A chan 和 初始 化 与 P2 的 握手 来 发 送 数 据 。 握 手 完成 后 , Pl 知道 数据 已 被 接收 ,于 是 继续 

执行 。 | : 


channe! chan : integer; 
P1: P2: 


send(chan, msg);  receive(chan, m); 





a) 原始 消息 传递 b) 通过 共享 变量 传递 
图 5-5 阻塞 式 消息 传递 转换 


注意 ,在 前 面 的 例子 中 ,数据 传递 是 发 送 器 发 起 的 。 如 果 是 由 接收 器 发 起 的 ,传递 方式 是 
类 似 的 ,所 不 同 的 是 接收 器 要 发 出 请 求 ,并 且 要 等 竺 发送 器 的 确认 ,指出 消息 是 可 用 的 。 接 收 
器 读 出 消息 后 取消 请 求 。 

上 述 转换 技术 的 困难 之 处 在 于 ,虽然 生成 了 功能 正确 的 代码 ,但 代码 往往 被 发 送 和 接收 时 
所 需 的 语句 细节 搞 得 很 混乱 ,不 具备 可 读 性 。 然 而 ,我 们 可 以 很 容易 地 把 发 送 和 接收 的 细节 封 
装 在 某 些 过 程 中 ,从 而 提高 代码 的 可 读 性 。 如 图 5-6a 中 那样 ,将 所 有 与 通道 有 关 的 信号 组 合 
为 一 个 记录 结构 ,可 以 进一步 提高 代码 的 可 读 性 。 在 这 个 例子 中 ,声明 了 一 个 记录 类 型 inte- LP 
ger _channel ,包括 三 个 域 :一 个 整 型 域 表 示 消 息 ,两 个 布尔 类 型 域 表 示 请 求 和 确认 。 进而 , 定 
义 了 一 个 发 送 过 程 send , 它 有 两 个 参数 ,分 别 表示 通道 和 其 他 消息 。 接 收 过 程 receive 的 声名 
与 之 类 似 。 有 了 这 两 个 过 程 和 记录 类 型 ,只 需要 正确 声明 一 个 记录 类 型 的 通道 ,并 利用 发 送 / 
接收 例 程 ,如 图 5-6b 中 所 示 。 值 得 注意 的 是 ,在 这 种 通信 方式 下 ,用 包含 显 式 消息 传递 结构 的 
语言 接近 于 抽象 描述 (比较 图 5-5a 和 图 5-6b)。 


type | r_channel Is record 
msg: r; 


Q 











signal chan : integer_channel; 
pi: P2: 
send(chan, msg);  receive(chan, m); 


















a) 细节 隐藏 声明 b) 隐藏 细节 后 的 传递 
图 5-6 消息 传递 转换 
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如 果 目 标语 言 允 许 过 程 名 的 重用 , 像 VHDL, 则 可 以 声明 多 个 名 为 send 和 receive 的 过 
程 ,每 个 程序 具有 不 同 的 通道 和 消息 类 型 。 否 则 ,可 以 给 每 个 发 送 / 接 收 过 程 起 一 个 唯一 的 名 
字 , 用 来 区 别 所 传递 的 数据 类 型 ,例如 send _integer 和 send _ character。 


5.3.2 非 阻 塞 式 消息 传递 

非 阻塞 式 消息 传递 (non-blocking message passing) 与 阻塞 式 消息 传递 的 区 别 在 于 : 非 阻塞 
式 消息 传递 的 发 送 占 不 用 等 待 (阻塞 ) 到 消息 被 接收 后 再 继续 执行 。 其 结果 造成 在 某 一 特定 时 
间 ,通道 内 可 能 会 有 不 止 一 条 已 经 发 送 但 尚未 接收 的 消息 。 在 这 种 情况 下 ,通道 按 一 个 隐 含 队 
列 工作 :每 次 发 送 时 将 一 条 消息 添加 到 队列 中 ,每 次 接收 时 从 队列 中 删除 一 条 消息 。 要 实现 非 
阻塞 式 消息 传递 的 转换 ,应 修改 我 们 的 转换 技术 以 明确 地 描述 这 个 队列 。 

对 于 每 个 通道 ,用 图 5-7 中 所 示 的 进程 模拟 
BAY ’ 声 明 一 个 找 述 队 列 的 变 量 o H 在 假设 已 经 P variable msg_queue : integer_queue_type(queue_size); 
定义 了 一 个 队列 数据 类 型 及 其 访问 例 程 (例如 添 | "9" 
WM ABR). KA P1 到 P2 的 非 阻塞 式 数据 发 送 可 gehan send ea then 
LAM Pl 到 队列 进程 的 阻塞 式 发 送 和 从 队 GueueAddimse_queue chan.send_msg); 
列 进程 到 P2 的 阻塞 式 接收 。 当 P1 请 求 发 送 时 ，| ergi esha 
队列 进程 接收 消息 并 将 其 添加 到 队列 中 。 当 P2 tf (Chan ree req) then an rec meo); 
请 求 接收 时 ,队列 进程 从 队列 中 删除 一 条 消息 并 chan.rec_ack <= tue; 
将 其 发 送 。 尽 管 发 送 和 接收 被 转换 成 阻塞 的 , 阻 | Ont 
塞 并 不 会 使 传递 发 生 时 延 。 没 有 时 延 是 因为 队列 
进程 对 发 送 和 接收 请 求 的 响应 非常 迅速 ,因为 它 、 i : 
除了 响应 请 求 外 别 无 他 用 。 形 成 对 比 的 是 ,图 55 IN 
中 所 示 的 阻塞 式 传递 中 不 存在 这 种 迅速 的 响应 ,因为 P2 还 有 很 多 其 他 的 动作 ,因而 也 许 还 没 
有 准备 好 对 请 求 做 出 迅速 响应 。 与 队列 进程 进行 通信 只 需要 很 小 的 握手 时 延 ,这 是 可 以 忽略 
的 ,也 就 是 说 发 送 右 的 总 体 效果 与 非 阻塞 式 情况 相同 。 

注意 每 个 通道 需要 两 组 消息 .请 求 和 确认 信和 号 ,一 组 用 于 发 送 舌 和 队列 进程 之 间 , 另 一 组 
用 于 队列 进程 和 接收 髓 之 间 。 | | 

同时 也 应 注意 的 是 :队列 的 分 配 既 可 以 是 静态 的 也 可 以 是 动态 的 。 如 果 使 用 静态 分 配 , BA 
列 空间 必须 足够 大 ,要 能 够 处 理 队 列 中 可 能 会 出 现 的 最 大 数目 的 消息 。 尽 管 隐 含 队列 应 该 是 
无 穷 大 的 ,但 对 于 特定 系统 仍 可 以 用 [AB91 ] 中 的 技术 来 确定 其 队列 大 小 最 大 值 。 这 是 很 重要 
的 ,因为 如 果 队 列 有 固定 的 大 小 , 它 就 有 可 能 被 充满 ,这 时 发 送 请 求 就 会 被 阻塞 ,直到 接收 操作 
从 队列 中 取 走 数据 。 | 

[LLGR92] 中 提出 了 一 种 类 似 的 建 模 非 阻塞 式 消 息 传递 的 方法 ,其 不 同 点 是 它 为 每 个 过 程 ， 
构造 一 个 发 送 接收 消息 的 进程 ,而 不 是 对 每 个 通道 构造 一 个 进程 。 

综 上 所 述 , 把 阻塞 式 和 非 阻塞 式 消 息 传递 结构 转换 成 不 支持 此 结构 的 语言 时 仍 可 保持 通 
信 的 抽象 性 ,因为 可 以 很 容易 地 将 细节 封装 在 过 程 中 。 


5.4 并 发 
很 多 模型 都 可 以 描述 并 发 行为 。 其 中 有 些 模 型 允许 数据 流 描 述 ,每 种 操作 同 其 他 操作 并 


wait until chan.send_req or chan.rec_req; 
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行 转换 数据 。 其 他 的 模型 允许 顺序 控制 线程 分 叉 成 知 干线 程 , 然 后 再 合并 成 一 个 线程 。 下 面 
说 明 如 何 将 这 两 种 不 同 的 并 发 类 型 转换 成 并 发 任务 模型 。 


5.4.1 数据 流 

在 数据 流 描 述 中 ,有 一 组 操作 将 输入 数据 流转 换 成 输出 数据 流 ,如 3-1 节 所 讨论 的 。 将 数 
据 流 图 转换 成 顺序 语句 有 两 种 技术 ,一 种 技术 对 每 个 数据 流 图 使 用 一 个 进程 (数据 流 图 进程 技 
术 ) , 另 一 种 技术 对 每 个 数据 流 操作 使 用 一 个 进程 (操作 进程 技术 )。 

在 数据 流 图 进程 (one-process-per-graph) 技 术 中 ,每 个 输出 通过 算术 表达 式 描述 为 输入 的 
函数 。 所 有 输出 在 同一 进程 中 计算 , 当 任 意 输 入 发 生变 化 时 ,都 要 重新 计算 所 有 输出 。 举 例 说 
明 ,考虑 图 5-8a 中 的 数据 流 图 。 输 入 AJ 相 加 ,生成 输出 O。 相 加 的 结果 作为 输入 连同 输 
人 天 一 起 进行 操作 OA ,生成 输出 已 。 图 5-8b 为 该 这 个 数据 流 图 转换 成 的 进程 ,计算 中 间 值 
sum 并 将 它 赋值 给 O ,然后 将 Op (sum ,KK ) 的 结果 赋值 给 P,Op BRT BR. 4 ILI RK 

发 生变 化 ,该 进程 重复 以 上 计算 过 程 。 





O P 
a) 原始 数据 流 图 b) 数据 流 图 进程 c) 数据 流 操作 进程 


图 5-8 数据 流转 换 


另 一 种 选择 是 使 用 操作 进程 (one-process-per-operation) 技 术 , 每 个 操作 都 描述 为 一 个 进 
程 ,操作 间 的 数据 用 全 局 信号 表示 。 每 个 进程 监控 输入 数据 的 变化 ,检测 到 变化 后 就 重新 计算 
新 的 输出 数据 。 图 5-8c 是 这 种 技术 的 一 个 例子 。 过 程 AddProcess 计算 1+] BARRA 
全 局 信号 sum AHO. 4 I RI 变化 时 ,重复 此 过 程 。 同 时 , 另 一 个 过 程 OpProcess 计算 
Op ( sum ,KK ) 并 将 结果 赋值 给 输出 Po 4 sum 或 K 发 生变 化 ,重复 此 过 程 。 

这 两 种 技术 可 以 结合 起 来 ,对 于 给 定 的 数据 流 图 ,每 个 子 图 用 一 个 进程 表示 。 进 程 等 待 子 
图 的 输入 变化 ,然后 得 到 子 图 的 输出 。 如 果 把 每 个 操作 看 做 一 个 子 图 ,那么 操作 进程 技术 就 化 
为 数据 流 图 进程 技术 的 一 种 特殊 情况 。 

可 以 扩展 这 些 转换 技术 ,对 层次 化 数据 流 图 进行 操作 。 层 次 化 数据 流 图 中 的 操作 可 以 定义 成 
另 一 个 数据 流 图 。 如 同 对 层次 化 状态 机 的 处 理 方法 ,在 转换 时 可 以 保留 层次 或 者 层次 平面 化 。 在 
每 个 数据 流 进程 技术 中 ,通过 详细 描述 每 层 操作 的 子 图 保留 层次 。 在 操作 进程 技术 中 ,每 层 操作 用 
一 个 过 程 描述 ,这 个 进程 分 成 若干 个 与 子 图 中 的 操作 相对 应 的 过 程 。 与 状态 机 相同 ,保留 层次 的 优 
点 在 于 数据 流 图 和 生成 的 进程 间 存 在 简单 的 对 应 关系 。 这 样 做 的 缺点 是 缺乏 硬件 高 效 性 。 

另 一 种 层次 化 操作 技术 在 [TLK90j 中 有 说 明 。 这 项 技术 实质 上 与 操作 进程 技术 相同 , 扩 
展 之 处 在 于 把 每 个 进程 封装 成 一 个 结构 元 素 。 这 种 封装 可 以 很 好 地 支持 层次 化 数据 流 图 ,由 
于 每 个 操作 用 一 个 元 素 表示 ,多 层 操 作 就 可 以 用 一 组 互联 元 素 表 示 出 。 

还 可 以 扩展 这 些 数据 流转 换 技 术 ， 处 理 不 明 操 作 (uninterpreted operation)。 不 明 操 作 没有 


~] 
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对 功能 的 详细 解释 。 在 这 种 情况 下 , 当 输 人 有 效 时 生成 输出 ,但 是 输出 的 值 是 未 知 的 。 这 种 输 


出 称 为 标记 (token)。 对 这 种 操作 的 转换 技术 与 上 面 说 明 的 操作 进程 技术 类 似 :同样 声明 全 局 
信号 来 表示 操作 之 间 的 数据 ,但 是 这 些 信 号 是 简单 的 布尔 类 型 ,用 来 说 明 标 记 是 否 存 在 。 每 个 
进程 等 待 它 的 每 个 输入 都 有 了 一 个 标记 ,然后 为 它 的 各 个 输出 生成 一 个 标记 。 这 种 处 理 不 明 
操作 的 技术 在 [HAWW88] 中 有 所 说 明 。 | 

最 后 ,还 可 以 扩展 这 些 转 换 技术 来 处 理 允许 数据 排队 (实际 数据 或 者 标记 ) 的 数据 流 模 
型 。 在 转换 过 程 中 ,队列 可 以 使 用 5.3.2 节 中 的 技术 显 式 表示 出 来 。 


5.4.2 FX 

分 又 (fork) 是 在 一 个 控制 线程 中 激活 阁 干 并 发 线程 的 点 。 在 某 些 情况 下 ,这 些 活 动 线程 
是 简单 的 语句 ;其 他 情况 下 ,它们 是 复合 任务 。 下 面 说 明 如 何 处 理 以 下 两 种 类 型 的 分 义 。 | 

1. %6] R(Statement-level) 

语句 级 分 叉 出 现在 单一 控制 线程 并 行 执 行 若干 语句 时 。 完 成 这 些 语句 后 ,线程 继续 执行 
后 面 的 语句 。 通 过 插入 临时 变量 能 把 语句 级 分 义 转 换 成 顺序 语句 描述 。 临 时 变量 的 功能 是 : 
保证 并 行 语句 中 所 有 变量 的 值 在 所 得 到 的 顺序 语句 中 保持 不 变 , 只 有 在 全 部 初始 并 行 语句 都 
执行 后 才能 更 新 。 

例如 ,图 5-9a 中 是 一 个 语句 级 分 又 结构 。 Statement| 执 
行 后 ,z := y Aly := xz 并行 执 行 ,实现 x 和 y 的 交换 。 交 换 
后 ,继续 执行 Statement2. Al 5-9b 是 将 同一 个 分 叉 转换 成 一 
种 不 存在 并 行 语句 结构 的 语言 。 在 转换 的 过 程 中 ,将 并 行 语句 
的 每 个 写 变 量 操 作 替 换 成 写 人 临时 变量 。 于 是 , 写 入 xz RR 
成 写 人 x _temp。 在 所 有 语句 的 最 后 ,加 入 了 用 临时 变量 的 值 ”原始 并 发 赋值 D BUF) 
更 新 每 个 变量 值 的 语句。 因而 x PUL AN x _temp 的 值 。 注 图 5-9 并 发 赋值 转换 
意 ,如 果 一 个 变量 ,例如 y, 在 并 行 语句 中 写 和 人 之 后 不 被 读 出 ， 
就 无 须 引 入 临时 变量 ,因为 立即 更 新 变量 不 会 影响 最 终结 果 。 

将 并 行 语句 映像 到 顺序 语句 的 过 程 非常 有 用 ,特别 是 基于 软件 编译 的 目的 ,将 之 转换 成 标 
准 的 顺序 程序 设计 语言 的 情况 下 。 

2. 任务 级 (Task-level) 

任务 级 分 义 出 现在 单一 控制 线程 并 行 激活 多 个 任务 时 。 完 成 一 个 或 多 个 这 样 的 任务 后 ， 
该 线程 继续 执行 。 通 过 引入 一 组 全 局 信号 能 把 任务 级 分 叉 转换 成 一 组 并 发 任务 ,全 局 信号 的 
作用 是 激活 分 叉 中 的 任务 ,并 且说 明 任 务 的 完成 情况 。 

例如 ,图 5-10a 中 是 一 个 任务 级 分 义 。Statement1 执行 后 ,程序 段 Pl 和 P2 并 行 执行 。 
当 两 个 程序 段 都 完成 后 , Statement2 继续 执行 。 注 意 到 这 个 例子 与 上 个 例子 唯一 的 区 别 在 于 
并 行 执行 的 行为 的 规模 。 图 5-10b 表示 将 分 叉 转换 成 一 组 并 行进 程 , 每 个 分 叉 的 程序 段 对 应 
一 个 进程 : P1 _ process 等 待 全 局 信号 fork 被 赋值 ,接着 执行 P1 process, HRES Pl _ 
done. P2_ process WE CHW. KORN TMA fork 的 语句 ,以 及 等 待 P1 _ done 
Al P2 _ done 被 赋值 的 语句 。 

为 了 说 明 变 化 后 是 如 何 执行 分 又 的 ,考虑 下 面 的 执行 过 程 :首先 执行 Statement1。 然 后 
赋值 给 fork ,激活 P1_ process 和 P2 _ process. P1_ process 调用 程序 段 P1, P1 返回 后 ,赋值 
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给 P1_ done. P2_ process 的 执行 过 程 相 类 似 。 经 过 一 段 时 间 ,P1 _ done 和 P2 _ done 都 被 
赋值 ,继续 执行 Statement2。 其 他 进程 等 待 fork 被 再 赋值 。 

[NVG91b, JPA91，MW9%0j] 中 详细 前 明了 类 似 的 分 又 操作 技术 , 主要 的 区 别 在 于 控制 信 
号 的 数目 。 


signal fork, P1_done, P2_done : boolean; 


Main : process P1_process : process 
begin begin 


statementt; wait until fork; 
P1; 


fork <= true; 
wait until P1_done P1_done <= true; 
P2_done; wait until not fork; 
als P1i_done <= false; 





a) 原始 分 叉 b) 并 发 任务 
图 5-10 分 义 转换 


5.5 异常 处 理 


通常 ,由 外 部 事件 导致 的 异常 要 求 迅 速 终止 正在 执行 的 操作 。 插 入 对 事件 的 检查 ,检测 到 
事件 后 跳 转 到 程序 末尾 ,就 可 以 把 描述 这 种 异常 的 结构 转换 成 一 组 顺序 描述 。 这 种 对 一 个 事 
件 重复 检查 称 为 转 态 (polling)。 | 

例如 ,图 5-11a 给 出 了 一 组 名 为 工 的 语句 ,事件 e 发 生 后 立即 停止 。 停 止 后 执行 语句 S- 
图 5-11b 表示 出 了 转换 成 没有 异常 结构 的 语言 后 对 异常 的 操作 。T 中 的 每 个 语句 后 都 有 一 
个 检查 事件 的 计 语 句 。 如 果 事 件 e RA ,通过 一 条 goto 语句 跳 转 到 S 的 开头 ,忽略 T PRR 
的 部 分 。 如 果 事 件 没 有 发 生 , 工 正 常 执行 。 

需要 注意 的 是 ,上 述 方法 的 基础 是 假设 目标 语言 支持 goo 语句 。 然 而 ,为 了 鼓励 结构 化 程序 
环境 ,大 多 数 的 程序 设计 语言 不 支持 goto 语句 。 虽 然 如 此 ,大 多 数 语言 还 是 支持 从 循环 中 的 任意 
位 置 跳出 ,适合 进行 异常 处 理 。 图 5-11c 举例 说 明 如 何 利 用 跳出 循环 的 语句 代替 goto 语 句 进行 异 
常 处 理 。 将 工 放 在 一 个 循环 中 ,如 果 检 测 到 了 事件 ,就 跳出 这 个 循环 ,接着 执行 S; 如 果 没 有 检 
测 到 事件 ,要 在 执行 完 工 后 再 退出 循环 。 换 名 话说 ,永远 不 会 返回 到 了 循环 的 开头 。 


evente: T 一 > S; 


T: 
statementt; 
statement; 
statements; 





S: 
statement; 
statement5; 


a) 原始 异常 b) 带 goto 语 句 的 程序 c) 带 循环 退出 的 程序 
图 5-11 异常 转换 


jà 
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这 种 转换 技术 还 适用 于 结合 合 了 时 间 模型 (timing model) 的 语言 。 在 这 种 语言 中 ,只 有 专门 

语句 才 使 得 时 间 推 移 ,例如 VHDL 中 的 wait 语句。 因为 只 有 时 间 推 移 时 事件 才能 发 生 ,所 
只 需要 在 时 间 推 萝 语句 (time-advancing statement) 后 进行 事件 检查 。 

上 述 技术 在 实现 正确 功能 的 同时 ,也 存在 着 缺点 ,这 是 因为 重复 的 事件 检查 使 结果 描述 显 
得 很 混乱 ,原始 功能 变 得 难于 理解 。 有 一 种 常用 工具 可 以 减少 混乱 ,使 结果 语句 容易 阅读 。 这 
个 技术 把 原始 语句 集合 分 成 若干 子 集 ,每 个 子 集 看 成 一 个 状态 ,当前 状态 用 弧 线 连接 到 下 一 个 
状态 ,与 接着 要 执行 的 语句 集 连接 起 来 。 在 这 个 方法 中 ,异常 处 理 就 是 给 状态 机 的 每 一 个 状态 
次 加 一 条 指向 最 终 状 态 的 弧 线 ,只 有 当 异 和 常 发 生 时 才 沿 此 弧 线 转换 。 这 个 状态 机 可 以 按照 
5.2 节 中 的 方法 进行 转换 。 例 如 ,图 5-12a 给 出 了 工 转 换 成 的 FSM, 包 括 添 加 的 异常 处 理 的 弧 
线 。 可 以 将 这 个 FSM 变 回 图 5-12b 中 的 顺序 程序 。 因 为 每 个 状态 之 后 都 会 检查 事件 e ,所 以 
可 以 仅 在 循环 条 件 中 进行 检查 。 这 样 ,任意 时 刻 如 果 e 发 生 了 ,不 会 转移 到 下 一 个 状态 ,而 是 
接着 执行 S。 注 意 这 里 只 有 一 条 检查 事件 e 的 语句 ,与 图 5-11c 中 的 多 条 语句 不 同 。 


T:start 


一 下 
State := 
while ire ye 


statement! 
note 

€ statement? 
not e 


statement3 





finish 
a) 转换 成 FSM 模型 b) FSM 描述 


图 5-12 异常 转换 


上 面 的 例子 很 清楚 地 说 明了 不 同 语言 的 转换 与 不 同 模 型 的 转换 两 种 转换 之 间 的 区 别 。 
顺序 程序 模型 中 的 异常 处 理 首先 被 转换 成 FSM 模型 中 的 结构 ,然后 又 变 回 顺序 程序 模型 。 图 
5-11: 中 的 程序 是 由 原始 顺序 程序 直接 转换 而 来 ,图 5-12b 中 的 顺序 程序 结果 比 图 5-11c 中 的 
程序 更 加 结构 化 和 易 读 。 


5.6 从 程序 状态 机 到 任务 


5.6.1 概述 

本 章 前 面 各 节 介 绍 了 一 组 各 种 模型 性 质 转换 的 技术 。 现 在 可 以 考虑 如 何 借 由 对 这 些 技术 
的 处 理 将 整个 程序 状态 机 概念 化 模型 PSM 转换 成 并 发 任务 模型 。 这 种 转换 可 以 用 来 实现 诸 
如 SpecCharts 到 VHDL 的 语言 转换 。 

PSM 模型 能 支持 并 发 任务 模型 不 能 支持 的 三 个 特性 :状态 迁移 任务 级 分 又 和 异 稼 处 理 。 
一 种 直接 的 转换 方案 是 利用 本 章 介 绍 的 技术 对 每 个 特性 分 别 转换 。 但 是 如 果 能 对 前 面 的 技术 
稍 加 修改 ,就 能 在 保证 并 发 任务 与 原始 PSM 功能 等 价 的 同时 ,大 幅度 提高 生成 描述 的 可 读 性 
和 关联 性 。 

首先 ,将 每 个 程序 状态 映像 到 它 自己 专 有 的 进程 上 ,而 不 是 将 顺序 程序 子 状态 映像 到 case 
分 支 语 句 中 的 动作 。 因 为 如 果 每 个 程序 状态 都 有 一 个 进程 ,PSM 就 能 很 容易 地 同 这 些 进程 对 
应 起 来 。 其 次 ,使 用 一 个 信和 号 来 说 明 某 个 程序 状态 的 进程 应 该 终止 ,而 不 是 显 式 地 对 进程 中 所 
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有 语句 进行 转 态 。 新 的 信号 可 以 是 布尔 类 型 的 , 当 任 意 相 关 的 异常 发 生 时 其 值 为 真 。 使 用 这 


个 信号 可 以 使 生成 进程 的 表达 更 加 简单 ,更 加 易 读 。 

根据 这 些 修 改 后 的 技术 ,现在 可 以 引出 一 种 将 PSM 转换 成 并 行 任务 的 新 的 方法 。 的 确 ， 
已 经 有 人 研究 了 将 PSM 的 某 些 特性 转换 成 并 发 任务 的 方法 [DCH91, AWC90, JPA91, 
MW901], 但 是 没有 人 用 统一 的 方法 研究 过 PSM 的 全 部 特性 ,这 正 是 我 们 的 目标 。 

在 这 种 转换 方法 中 ,总 是 认为 每 个 程序 状态 有 挂 起 (inactive)、 执 行 (executing) 或 者 完成 
(complete) 三 种 状态 之 一 。PSM 模型 中 的 每 个 程序 状态 能 映射 到 具有 这 三 个 不 同 部 分 的 进程 
ko 在 “执行 ”状态 中 ,表示 复合 程序 状态 的 进程 会 设置 和 清除 控制 信号 ,以 便 激活 或 者 挂 起 程 
序 子 状态 对 应 的 进程 。 如 果 目 标语 言 在 声明 域内 支持 模块 结构 , 则 可 以 使 用 髋 套 结构 来 保留 
PSM 的 层次 。 | 


5.6.2 算法 

算法 5.6.1 是 利用 上 述 概念 将 SpecCharts 转换 成 等 价 的 VHDL 描述 的 递归 算法 。 详 细 
的 算法 参见 LNVG91b]。 在 SpecCharts 中 ,程序 状态 称 为 行为 (behavior) ,在 VHDL 中 ,任务 用 
进程 描述 。 算 法 的 输入 是 SpecCharts 行为 ,输出 是 VHDL 描述 。 算 法 使 用 子 程序 CreateCom- 
pletionHandshake(B) 生 成 一 组 描述 :首先 ,通过 给 信和 号 B _ complete 赋值 ,指出 行为 BRASS 
成 ;然后 等 待 父 行 为 通过 清除 信号 B _active 的 值 使 B 挂 起 ;最 后 清除 B _complete。 子 程序 
CreateWaitOnArcs(arcs ) 生 成 wait 等 竺 语句 ,用 来 判断 是 否 要 沿 着 弧 线 发 生 迁 移 。 当 于 行为 
S 已 经 完成 ,并 且 满 足 弧 线 上 的 完成 迁移 (transition-on-completion) 条 件 ,或 者 子 行为 S 正在 
活动 ,并 且 满 足 弧 线 上 的 立即 迁移 (transition-immediately) 条 件 ,就 会 发 生 迁 移 。 子 程序 Cre- 
ateArcsI f (arcs ) 为 每 个 绝 线 分 支 生 成 if-then-else 语句 。 每 个 分 支 的 描述 ,终止 当前 的 子 行为 ， 
同时 激活 弧 线 的 目的 子 行为 。 子 程序 InsertPolling (stmts , active _sig ) 在 程序 段 stmts 中 插入 
转 态 代码 ,如果 active _sig 被 赋值 则 跳 转 到 程序 未 尾 , 如 5.5 节 中 所 讨论 的 。 子 程序 CreateS- 
ignalShutoffs(stmts 21k stmts 中 全 部 信号 的 驱动 。 这 个 操作 是 很 必要 的 ,因为 非 活 动 行为 
的 进程 必须 完全 被 忽略 ,所 以 不 应 再 驱动 信号 值 。VHDL 信和 号 驱动 器 的 更 详细 的 说 明 参 见 
[IEE88]。 最 后 , 子 程序 Append (i,m) 可 以 把 表 m REI ARES 

从 当前 层次 的 顶端 ( 根 ) 行 为 开始 ,算法 按 深度 优先 的 顺序 遍历 行为 ,对 每 个 访问 的 行为 输 
出 VHDL。 每 个 行为 的 VHDL 代码 封装 在 一 个 模块 中 ,使 得 内 套 模块 保留 了 SpecCharts 的 层 
次 和 声明 的 正确 作用 域 。 

算法 5.6.1:BehaviorToVhdl(B) 


output start of block labeled B _ block ,with B. declarations 
if IsCompositeBehavior( B ) then 
for each S in B. subbehaviors loop 
output boolean signal declarations S _ active, S _ complete 
BehaviorToVhdl(S)/* 递归 调用 * / 
end loop 
end if 


/x* 挂 起 部 分 * / 
stmts = NULL 
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Append( stmts , “wait until B _ active;”) 


/* 执行 部 分 * / 
if IsCompositeBehavior( B ) then 
Append( stmts , “loop” ) 
Append( stmts , CreateWaitOnArcs( B. arcs )) 


Append( stmts ,CreateArcsI{( B. arcs )) 


Append( stmts , “end loop;”) 
elseif IsLeafBehavior( B) 
Append( stmts , B. statements ) 
end if 


/x 完成 部 分 * / 
Append( stmis , CreateCompletionHandshake( B) ) 


InsertPolling( stmts , B _ active) 

Append( stmts , CreateSignalShutoffs( stmts ) ) 
output process with label B and statements stmts 
output end of B _ block 


VHDL 进程 包含 在 与 每 个 行为 相关 的 VHDL 模块 中 ,包括 三 个 部 分 : 

1) 挂 起 (Jnactive) :在 这 个 部 分 ,行为 等 待 被 激活 (与 父 行为 对 应 的 进程 给 控制 信号 赋值 )。 

2) 执行 (Executing) :这 个 部 分 的 复合 行为 通过 控制 信号 激活 或 挂 起 相应 的 子 行为 。 叶 子 
行为 执行 其 VHDL 代码 。 

3) 完成 (Complete) :通过 控制 信号 指定 已 完成 ， 等 待 父 行为 清除 控制 言 号 值 后 挂 起 。 
注意 算法 可 以 通过 控制 信号 B _active 实现 挂 起 ,因为 在 这 种 情况 下 进程 能 跳 转 到 其 末尾 ， 使 
得 进程 重新 进入 挂 起 部 分 。 

本 节 介 绍 的 转换 算法 具有 若干 优点 。 首 先 ,VHDL 与 SpecCharts 在 任何 情况 下 的 功能 都 
是 等 价 的 , 而 不 像 前 面 的 方法 那样 ,仅仅 在 一 个 子 集 内 等 价 。 其 次 ,算法 在 VHDL 输出 中 保留 
T SpecCharts 的 行为 层次 ,而 且 SpecCharts 行为 和 VHDL 进程 是 一 一 对 应 的 ,SpecCharts 和 
VHDL 之 间 存 在 简单 的 关联 。 最 后 一 点 ,算法 的 递归 形式 很 容易 实现 


5.6.3 时间 调 整 

我 们 说 明 的 转换 方法 存在 一 个 问题 ,可 能 导致 不 正确 的 模拟 。SpecCharts 允许 信号 在 一 
个 无 限 小 的 时 间 单 位 ( 称 为 delta) 后 更 新 。 这 些 信号 被 转换 成 VHDL 信号 。 同 时 ,转换 方法 还 
引入 了 新 的 用 于 进程 控制 的 信和 号。 现在 假设 因为 某 个 事件 ,行为 B 需要 被 挂 起 。B 的 父 行为 
会 检测 到 这 个 事件 并 给 控制 信号 赋值 ,使 B 终止 它 的 动作 。 然 而 ,进程 控制 信号 只 有 在 delta 
时 间 后 才能 更 新 ,在 这 期 间 ,SpecCharts 可 能 在 不 该 更 新 的 时 候 更 新 了 。 概 括 地 说 ,进程 控制 
信号 更 新 时 需要 的 delta 时 间 可 能 会 干扰 到 SpecCharts 信号 更 新 时 需要 的 delta 时 间 。 

简单 的 解决 方法 是 将 SpecCharts 信和 号 更 新 所 需 的 时 间 调 整 为 比 控制 信号 更 新 所 需 的 时 间 
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更 长 的 时 间 单 位 。 例 如 ,可 以 将 SpecCharts 信和 号 更 新 所 需 的 时 间 调 整 为 飞 秒 (femtosecond) 的 
时 间 级 别 ;类 似 地 ,可 以 把 一 个 时 间 调 整 到 比 另 一 个 时 间 高 一 个 数量 级 。 在 这 种 情况 下 ,模拟 
输出 的 时 间 也 需要 调整 。 方 法 细节 参见 [VG91 ]。 

需要 注意 的 是 ,同样 的 信号 干扰 问题 在 任何 引入 了 控制 信和 号 的 转换 方法 中 都 可 能 出 现 ,前 
面 涉及 的 大 多 数 方法 都 有 可 能 。 在 每 种 方法 中 都 可 以 这 样 进 行 时 间 调 整 。 


5.6.4 综合 

用 这 种 转换 方法 生成 VHDL 还 有 另 一 个 潜在 的 问题 : 当 使 用 VHDL 综合 工具 的 时 候 , 可 
能 会 带 来 硬件 上 的 低 效 ,主要 是 因为 当前 的 综合 工具 假设 ,实现 每 个 VHDL 过 程 需要 一 个 控 
制 器 和 一 个 数据 通路 。 因 为 生成 的 VHDL 每 个 行为 只 包含 一 个 进程 ,根据 VHDL 进行 综合 的 
结果 可 能 会 生成 额外 的 控制 器 和 低 效 的 数据 通路 。 解 决 这 个 问题 的 简单 方法 就 是 在 转换 前 将 
多 层次 化 行为 展 平 ,成 为 单个 叶 行 为 的 顺序 语句 。 这 种 展 平 化 易于 自动 实现 。 


5.7 结论 和 发 展 方向 


前 端 语 言 是 任何 系统 描述 环境 的 基本 组 成 部 分 ,因为 它 使 我 们 可 以 用 目 然 易 理解 的 方式 

描述 多 种 功能 。 在 实际 应 用 中 ,为 了 利用 已 有 的 工具 和 技术 ,前 端 语言 必须 转换 成 标准 语言 。 

本 章 介 绍 了 将 一 些 前 端 语 言 常 见 的 性 质 转换 成 标准 语言 VHDL 的 技术 。 类 似 的 技术 可 
以 用 来 将 其 他 的 前 端 语言 转换 成 多 种 标准 语言 。 将 这 些 技 术 结合 起 来 就 是 一 个 转换 器 ,这 使 
转换 器 实现 起 来 比 模拟 器 这 种 语言 支持 工具 简单 得 多 。 正 如 前 面 章 节 所 提 到 的 ,使 用 这 个 转 
换 器 支持 前 端 语言 可 以 充分 地 减少 描述 时 间 和 减少 功能 性 错误 。 

今后 的 工作 包括 开发 新 的 前 端 语言 ,为 多 种 系统 开发 转换 方法 。 还 有 支持 前 端 语 言 开 发 
的 工具 ,例如 调试 器 ,与 已 有 的 标准 语言 的 文 持 工具 衔接 。 


5.8 练习 
1. 考虑 如 下 顺序 语句 描述 的 VHDL We: 


process P 
begin 
wait on start for 100 ns; 
for l in lto n loop 
wait on input; 
sum := sum + input; 
end loop; : 
wait; 
end process; 
假设 当 条 件 (interrupt =“17) 为 真 时 , 想 要 跳 转 到 最 后 的 wait 语句 ,暂时 挂 起 进程 。 需 要 
如 何 修改 上 面 的 进程 才能 进行 这 个 异常 处 理 ? 
2. 重复 进行 上 面 的 进程 P 中 的 计算 ,利用 一 个 其 动作 仅 与 状态 间 迁 移 相 关 的 有 限 状 态 机 。 
3. 考虑 如 下 一 组 包含 fork-join 的 语句 : 
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P(); 
fork 
Q(); 
R(); 
join 
SQ); 
假设 PO. QO ROM S() 表 示 一 组 顺序 语句 。 用 只 有 单 层 进程 的 语言 ( 像 VHDL) 表 示 
上 面 的 fork-join 模型 。 
4. 说 明 使 用 顺序 语句 描述 有 限 状 态 机 的 5 种 不 同方 法 。 
5. 编写 一 个 将 有 限 状 态 机 转换 成 一 组 顺序 语句 描述 的 算法 。 
6. 编写 一 个 将 层次 化 有 限 状 态 机 变 成 只 “有 叶子 状态 的 算法 。 在 处 理 层次 化 FSM 前 经 常 需要 | 
这 样 做 。 忽 略 并 发 子 状 态 。 
7. 编写 一 个 算法 将 层次 化 程序 状态 机 展 平 成 为 只 包含 时 状态 的 程序 状态 机 。 需 要 处 理 TI 和 
TOC 弧 。 忽 略 并 发 程序 子 状 态 。 
“8. 简要 说 明 一 种 将 一 组 顺序 语句 摘 述 转换 成 一 组 等 价 的 数据 流 描述 的 方法 。( 提 示 :参考 
[CG93 | 中 的 分 配 决策 图 。) 
“o, 简要 说 明 一 种 算法 ,将 一 条 任意 复杂 的 VHDL 的 wat 语句 转换 成 一 组 语句 ,其 中 只 有 一 
条 很 弱 的 wait 语句 ,例如 ,wait until CLK = “1 7 。 这 个 算法 是 VHDL 到 C 的 转换 器 的 基 
本 组 成 部 分 。 | | 
“10. 简要 说 明 一 种 从 顺序 描述 中 提取 出 有 限 状态 机 的 方法 。 该 方法 应 能 支持 FSM 的 多 种 
表示 方式 。 








第 6 章 系统 划分 


在 前 四 章 里 面 ,我 们 介绍 了 系统 功能 描述 的 设计 ,对 其 中 的 模型 .语言 和 转化 等 关键 问题 


进行 了 讨论 。 在 获得 系统 功能 描述 后 ,设计 者 需要 关注 的 就 是 系统 设计 本 身 。 系 统 设计 中 一 
个 最 重要 的 和 最 具有 挑战 性 的 任务 就 是 对 系统 功能 进行 划分 , 即 在 满足 各 种 设计 约束 的 前 提 
下 ,将 系统 所 要 执行 的 功能 分 到 各 个 组 件 上 。 本 章 将 讨论 系统 划分 中 的 一 些 基本 问题 和 相关 
技术 。 

6.1 引言 


一 个 系统 中 含有 一 系列 组 件 ,如 标准 处 理 器 、 微 控制 器 .通用 或 专用 集成 电路 、 存 储 器 总 
线 等 ,通过 这 些 组 件 的 互联 通信 ,共同 实现 整个 系统 的 功能 。 为 了 获得 这 种 功能 的 实现 ,设计 
者 必须 解决 如 下 两 个 问题 :一 是 选择 一 系列 系统 组 件 , 即 分 配 (allocation); 二 是 将 系统 功能 分 
到 这 些 组 件 上 , 即 划 分 (partition)。 分 配 和 划分 必须 经 过 选择 ,使 得 最 后 的 实现 能 满足 设计 成 
本 性 能 .芯片 面积 和 功 耗 等 设计 约束 。 

本 章 将 对 系统 划分 进行 讨论 。 首 先 对 结构 划分 和 功能 划分 进行 对 比 ,并 针对 一 个 可 执行 
描述 来 详细 讨论 功能 划分 。 接 着 对 划分 中 的 主要 问题 及 基本 算法 进行 定义 ,介绍 硬件 组 件 功 
能 划分 中 的 一 些 已 公布 技术 。 然 后 对 软 硬 件 功能 划分 的 算法 和 技术 进行 讨论 ,硬件 组 件 由 设 
计 结 构 实 现 , 而 软件 组 件 由 软件 编译 所 得 。 在 本 章 最 后 ,将 给 出 一 个 在 可 执行 描述 划分 中 广泛 
应 用 的 例子 ,通过 这 个 例子 ,读者 可 以 更 好 地 掌握 这 一 章 的 内 容 。 


6.2 结构 划分 和 功能 划分 


系统 划分 有 两 种 不 同 的 方法 , 即 结构 划分 和 功能 划分 。 前 者 先 从 结构 上 来 实现 目标 系统 ， 
然后 对 其 进行 划分 ;而 后 者 则 先 对 系统 功能 进行 划分 ,然后 才 具 体 实现 。 下 面 将 详细 分 析 两 种 
划分 方法 的 特性 及 各 自 的 优点 。 为 简便 起 见 ,假设 在 进行 划分 之 前 ,系统 组 件 已 经 经 过 了 手工 
分 配 。 


6.2.1 结构 划分 

结构 划分 先 从 结构 上 来 实现 目标 系统 ,然后 对 其 进行 划分 。 这 里 的 结构 指 硬 件 对 象 之 间 
的 互联 ,其 中 硬件 对 象 可 以 是 逻辑 门 .触发 器 .寄存 器 传输 级 元 件 如 计数 器 或 寄存 器 等 ,也 可 以 
是 浮 点 乘法 器 、 傅 里 叶 变换 器 等 复杂 的 计算 单元 。 接 着 ,我 们 划分 结构。 划分 就 是 把 这 些 人 硬件 
对 象 分 为 不 同 的 组 ,其 中 每 组 都 代表 一 个 系统 组 件 。 

结构 划分 应 用 很 广泛 ,这 在 一 定 程度 上 依赖 于 其 自身 的 优点 。 首 先 , 通 过 结构 划分 ,能 够 
直接 获得 芯片 面积 和 引 脚 的 估算 值 ,一 个 组 的 面积 可 以 由 这 个 组 所 包含 元 件 的 总 面积 来 估算 ， 
而 引 脚 数 可 以 根据 该 组 和 其 他 组 之 间 的 连 线 数 来 估算 。 另 外 ,结构 划分 问题 可 以 映射 为 图 的 
划分 问题 , 且 对 图 的 划分 问题 有 一 套 成 熟 的 理论 .复杂 的 算法 和 相应 的 工具 来 进行 处 理 。 结 构 
划分 是 这 样 转化 为 图 的 划分 问题 的 :首先 定义 一 个 图 , 它 包 含有 若干 个 顶点 和 阁 干 条 边 , 其 中 
每 条 边 连 接着 顶点 的 一 个 子 集 。 每 个 顶点 和 每 条 边 都 赋 有 一 个 值 , 称 为 权重 。 定 义 结 群 (clus- 
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ter) p 为 项 点 的 一 个 子 集 。p 的 总 权重 (total weight) 为 其 中 所 有 顶点 权重 的 总 和 ; p 的 割 值 
(cutsize) 为 将 其 内 部 顶点 与 外 部 顶点 进行 连接 的 各 条 边 的 权重 之 总 和 。 将 系统 结构 中 的 每 个 
硬件 对 象 映 射 为 图 的 一 个 顶点 ,并 用 该 对 象 的 面积 作为 权重 ;再 将 其 中 每 条 互联 线 映 射 为 图 的 
一 条 边 ,以 互 连 接 的 线 数 作为 该 边 的 权重 。 通 过 这 样 的 映射 就 可 以 用 对 应 的 图 中 一 个 结 群 的 
权重 估算 结构 组 面积 ,用 对 应 该 结 群 的 割 值 估算 该 结构 组 的 外 部 引 脚 数 。 

对 于 很 多 系统 ,结构 划分 都 能 获得 较 好 的 结果 ,这 是 它 得 到 广泛 应 用 的 另 一 个 原因 。 在 过 
去 ,系统 组 件 的 数量 与 需要 划分 的 硬件 对 象 相 比 并 不 是 太 多 ,而 且 硬 件 对 象 的 数量 也 不 是 特别 
多 ,这 种 事实 使 得 该 方法 容易 获得 较 好 的 结果 。 但 是 ,需要 注意 的 是 : 随 着 近年 来 系统 组 件 和 
实现 系统 所 需 硬 件 对 象 的 数量 不 断 增长 ,结构 划分 的 能 力 受 到 了 较 大 影响 。 

总 的 说 来 ,结构 划分 存在 以 下 三 个 缺点 : 

1) 面积 /性 能 的 折 中 比较 困难 。 在 实现 系统 结构 的 时 候 , 由 于 后 续 的 划分 步骤 可 能 使 先 
前 的 决定 无 效 ,因此 很 难 在 面积 和 性 能 之 间 取 得 较 好 的 折 中 ,这 个 问题 在 片 间 通 信和 人 硬件 中 万 
为 突出 。 如 下 面 这 种 普遍 的 情况 所 示 :设计 者 希望 获得 一 个 满足 性 能 约束 的 最 小 的 系统 。 一 
种 方案 是 两 个 行为 共享 一 个 加 法 鱼 ， 假定 共享 加 法 器 会 减 小 必 片 面积 ,并 且 不 会 影响 性 能 。 但 
是 划分 的 结果 不 一 定 将 实现 这 两 个 行为 的 对 象 分 到 同一 个 芯片 上 。 为 了 获得 加 法 器 的 输入 数 
据 , 就 必须 有 芯片 间 的 数据 传输 ,这 势必 影响 系统 性 能 , 因 因此 共享 加 法 器 这 种 方案 并 不 好 。 瓦 
一 种 设计 方案 是 每 个 行为 都 使 用 各 自 的 加 法 器 。 但 如 果 划 分 结果 将 实现 这 两 个 行为 的 对 象 都 
划分 到 同一 个 芯片 上 ,那么 一 个 加 法 器 就 能 满足 使 用 。 这 个 例子 是 对 一 个 加 法 做 做 代价 和 性 
能 间 的 决策 ,而 在 实际 设计 的 系统 结构 中 需要 成 百 上 千 个 类 似 决策 。 通 过 上 面 的 简单 例子 ,可 
以 看 出 在 划分 之 前 做 这 些 决策 可 能 会 导致 很 差 的 结 采 。 

一 种 解决 方案 是 在 划分 后 对 结构 进行 调整 。 然 而 却 不 容易 对 结构 做 较 大 的 调整 。 这 是 因为 
一 个 简单 行为 会 映射 到 多 个 对 象 上 ,并 且 多 个 行为 可 能 共享 同一 个 对 象 。 改 变 一 个 对 象 可 能 会 
影响 到 其 他 行为 的 实现 部 分 ,并 且 无 法 估计 这 种 影响 会 有 多 大 。 因 此 通常 只 能 对 结构 做 一 些 较 
小 的 调整 ,如 引入 宛 余 门 , 或 者 锁 存 器 一 端的 门 移 到 另 一 端 。 对 于 软件 情况 也 类 似 : 在 产生 汇编 
代码 后 ,仅仅 能 对 性 能 做 一 些 较 小 的 优化 ,如 使 用 寄存 器 来 避免 访问 存储 器 ,而 类 似 于 把 代码 移 
植 到 多 处 理 器 系统 上 这 样 大 规模 的 改变 则 很 难 实现 。 对 于 硬件 和 软件 的 设计 ,具有 实质 性 的 调 
整 都 需要 高 层 的 功能 和 时 序 等 信息 ,而 这 些 信息 很 难 从 底层 的 结构 和 汇编 代码 中 提取 出 来 。 

2) 对 象 数量 巨大 。 由 于 系统 面积 的 增 大 ,实现 系统 所 需 对 象 的 数量 也 不 断 增长 。 这 种 巨 
大 的 对 象 数量 ,一 方面 使 得 划分 算法 的 结果 变 差 ; 另 一 方面 也 增 大 了 设计 者 在 划分 过 程 中 指 寻 
划分 的 难度 ,同时 划分 结果 也 更 难 被 设计 者 所 理解 。 | 

3) 全 硬件 方案 。 结 构 划 分 的 第 三 个 缺点 是 它 只 能 应 用 于 硬件 设计 。 如 果 将 处 理 器 或 微 
控制 器 作为 系统 组 件 来 进行 分 配 ,那么 部 分 功能 将 会 被 编译 成 软件 。 而 在 结构 划分 中 ,所 有 功 
能 都 首先 被 转换 为 结构 ,因此 这 种 软件 解决 方案 将 被 忽略 。 

随 着 系统 越 来 越 复杂 ,系统 组 件数 量 越 来 越 多 ,结构 划分 的 这 些 缺 点 显得 更 加 突出 。 


6.2.2 功能 划分 

功能 划分 首先 将 系统 的 功能 分 为 若干 个 不 “可 再 分 的 块 ,这 些 块 称 为 功能 对 象 (functional 
object)。 接 下 来 将 这 些 功能 对 象 划分 到 系统 组 件 上 ， 再 通过 软件 或 硬件 来 实现 每 个 组 件 的 这 
些 功 能 。 功 能 划分 和 结构 划分 相 比 ,主要 有 以 下 儿 个 优 后 。 
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1) 面积 /性 能 的 折 中 。 这 是 功能 划分 的 一 个 最 主要 的 优点 。 在 功能 划分 的 后 续 结 构 实 现 
步骤 中 ,由 于 有 了 所 有 划分 的 信息 ,能 够 在 面积 和 性 能 间 获 得 较 好 的 折 中 。 这 些 信息 还 使 得 系 
统 组 件 里 的 各 元 件 得 到 极 大 的 共享 。 此 外 ,根据 系统 组 件 间 的 数据 通信 ,也 可 以 精确 地 对 结构 
实现 的 性 能 做 估计 。 

2) 对 象 数量 较 小 。 功 能 划分 的 第 二 个 优点 是 减少 了 需要 划分 对 象 的 数量 。 功 能 对 象 的 
抽象 级 别 比 寄存 器 传输 级 要 高 ,功能 对 象 的 数量 和 寄存 器 传输 级 的 结构 对 象 数 量 相 比 要 少 很 
多 。 由 于 对 象 数 量 较 小 ,算法 的 性 能 得 到 了 提高 ,同时 也 更 容易 引入 设计 者 的 交互 作用 。 

3) 软 硬 件 协同 设计 。 这 是 功能 划分 最 重要 的 优点 。 功 能 划分 处 理 的 对 象 是 功能 ,允许 软 
硬件 划分 。 映 射 到 处 理 器 上 的 功能 对 象 可 以 编译 成 指令 集 来 实现 ,而 映射 到 硬件 上 的 对 象 则 
可 以 用 结构 来 实现 。 很 多 系统 都 包含 有 硬件 和 软件 两 部 分 ,这 强烈 要 求 划 分 方法 具有 在 软 硬 
件 之 间 进 行 划 分 的 能 力 。 

功能 划分 的 传统 做 法 从 非 正式 的 自然 语言 描述 开始 ,这 种 方法 不 能 满足 要 求 ,原因 有 如 下 
几 点 :首先 ,自然 语言 描述 无 法 被 计算 机 理解 ,无 法 实现 自动 评估 和 划分 ,因此 划分 结果 的 质量 
很 大 程度 上 依赖 于 设计 者 的 经 验 。 其 次 ,对 自然 语言 的 描述 无 法 在 设计 的 早期 进行 验证 ,因此 
系统 中 的 功能 错误 可 能 要 到 设计 的 末期 才能 够 发 现 。 再 次 ,自然 语言 描述 通常 比较 含糊 ( 见 
4.5 节 ), 这 使 整个 系统 的 集成 变 得 困难 。 当 另 一 个 设计 者 实现 系统 组 件 的 时 候 , 这 种 集成 问 
题 就 会 体现 出 来 。 不 同 的 设计 者 对 自然 语言 的 描述 有 不 同 的 理解 。 在 集成 系统 组 件 并 进行 测 
试 时 ,这 种 理解 的 不 同 就 可 能 表现 为 设计 错误 。 

为 了 解决 上 述 局 限 ,人 们 提出 了 可 执行 描述 的 划分 (executable-specification partitioning) 的 

念 。 在 这 种 功能 划分 的 特殊 方法 中 ,首先 用 可 执行 描述 语言 来 说 明 系 统 功能 ,然后 从 这 个 描 
述 中 获得 功能 对 象 ,再 对 其 进行 划分 。 和 多 数 基于 可 执行 语言 的 设计 方法 一 样 ,这 种 处 理 方法 
也 具有 其 共同 的 一 些 优点 。 首 先 ,这 种 描述 可 以 被 计算 机 理解 ,因此 可 以 开发 工具 来 自动 完成 
评估 和 划分 ,从 而 减少 了 对 设计 者 经 验 过 多 的 依赖 。 其 次 ,在 设计 早期 可 以 通过 模拟 来 对 摘 述 
进行 验证 并 修正 其 中 的 错误 ,以 减少 在 设计 后 期 进行 修正 所 带 来 的 成 本 开销 。 再 次 ,功能 对 象 
映射 到 哪 一 个 系统 组 件 在 形式 上 有 详细 说 明 ,因此 不 容易 对 功能 产生 不 同 的 解释 ,能 减少 集成 
和 实现 组 件 时 引发 的 错误 。 

对 可 执行 描述 的 划分 问题 ,已 经 提出 了 许多 技术 。 
但 由 于 这 个 领域 相对 较 新 ,多 数 技术 还 集中 于 一 般 的 功 
能 划分 问题 的 一 个 较 小 的 子 集 。 在 本 章 后 面 的 几 节 里 ， 
我 们 将 定义 功能 划分 中 的 关键 问题 ,对 基本 算法 进行 概 
述 ,然后 对 近年 来 所 公布 的 一 些 划 分 技术 进行 介绍 。 


6.3 划分 中 的 问题 


为 了 便于 理解 和 对 比 各 种 不 同 的 划分 技术 ,下 面 将 
整个 划分 问题 分 为 八 个 基本 问题 :系统 描述 抽象 级 别 、 粒 
BE .系统 组 件 的 分 配 .度量 和 评估 、 目 标 和 接近 函数 、 划 分 
算法 .输出 ,以 及 控制 流程 和 设计 者 的 参与 ,如 图 6-1 所 
示 。 值 得 注意 的 是 ,这 些 问 题 并 不 是 作为 正式 分 类 。 图 6-1 系统 划分 中 的 基本 问题 
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6.3.1 系统 描述 抽象 级 别 

各 种 划分 技术 一 般 都 通过 其 使 用 的 描述 语言 来 定义 划分 的 输入 。 然 而 ,同一 种 语言 可 以 
用 来 描述 多 个 不 同 的 概念 模型 ,这 些 模 型 分 别 需 要 不 同 的 划分 方法 ,因此 单 凭 语言 本 身 不 足以 
定义 输入 。 比 如 用 VHDL 来 描述 健 里 叶 变 换 , 就 可 以 分 别 从 算法 级 、 寄 存 器 传输 级 ,其 至 门 级 
等 不 同 级 别 进行 描述 。 

因此 ,根据 概念 模型 的 抽象 级 别 来 定义 输入 更 为 恰当 。 比 较 粗略 的 可 以 将 抽象 级 别 定 义 
为 系统 描述 中 低 复 杂 度 结构 对 象 数量 的 度量 ,抽象 级 别 越 低 ,说 明 低 复杂 度 结构 对 象 越 多 。 例 
如 一 个 描述 包含 了 系统 中 各 个 门 的 互联 情况 ,那么 它 的 抽象 级 别 也 就 必然 很 低 。 

在 不 同 划分 技术 中 ,考虑 到 了 多 种 抽象 级 别 的 描述 ,由 高 到 低 大 臻 有 如 下 几 种 : 

1) 任务 数据 流 图 。 输 入 代表 着 一 个 数据 流 图 ,其 中 每 个 操作 代表 一 个 任务 ( 见 2.4.1 
节 ), 而 任务 则 是 比 一 个 基本 算术 运算 复杂 得 多 的 计算 。 这 种 模型 没有 定义 每 个 任务 的 具体 计 
算 过 程 ,但 定义 了 各 个 任务 之 间 的 数据 传输 情况 ,以 及 每 个 任务 的 时 延 、 面 积 等 参数 。 

2) 任务 级 。 输 入 表示 一 系列 任务 ,其 中 每 个 任务 通过 一 个 顺序 程序 来 描述 ,这 在 2.7.3 
节 中 有 详细 介绍 。 任 务 级 通常 也 叫做 行为 级 。 

3) 算法 级 数据 流 图 。 输 入 为 数据 流 图 或 加 减法 之 类 的 算术 运算 ,还 可 能 带 有 一 些 控 制 操 
作 ,详细 说 明 请 参见 2.7.1 节 。 由 于 多 数 高 层次 综合 的 研究 和 工具 中 都 使 用 这 种 模型 ,因此 它 
也 是 划分 技术 中 最 通用 的 一 种 模型 。 这 种 模型 也 叫做 控制 /数据 流 图 , 即 CDFG. 

4) 带 数 据 通道 的 有 限 状 态 机 。 输 入 为 有 限 状 态 机 ,可 能 含有 复杂 的 表达 式 , 这 些 表达 式 
在 状态 内 或 状态 转换 间 进 行 计算 ,如 a = 5+cxXx4d, 对 于 有 限 状 态 机 在 2.3.1 节 中 有 详细 介 
绍 。 显 然 这 里 也 可 以 使 用 传统 的 有 限 状 态 机 , 它 只 允许 有 布尔 表达 式 , 在 某 些 情况 下 也 在 使 
用 。 

5) 寄存 器 传输 级 。 输 入 为 一 系列 的 寄存 器 传输 , 即 对 每 个 机 器 状态 都 提供 寄存 化 之 间 的 
传输 过 程 。 

6) 结构 级 。 输 入 为 物理 组 件 间 的 结构 互联 ,也 叫做 网 表 。 如 前 所 述 , 这 些 组 件 本 身 可 以 
是 不 同 抽象 级 别 。 

显然 ,一 个 描述 输入 中 的 不 同 部 分 可 以 属于 不 同 的 抽象 级 别 , 例 如 一 部 分 输入 是 任务 级 的 
描述 ,而 另 一 部 分 则 使 用 设计 好 的 门 级 互联 结构 描述 。 

不 同 是 抽象 级 别 代表 了 设计 中 不 同 的 中 间 实 现 体 。 由 于 设计 者 最 开始 从 较 高 抽象 级 别 中 
得 到 设计 概念 ,因此 通常 的 设计 都 从 较 高 的 抽象 级 别 开 始 ,在 后 续 较 低 抽 和 象 层次 里 加 入 结构 细 
节 的 信息 。 这 样 ,划分 输入 抽象 级 别 的 不 同 也 就 能 代表 划分 之 前 已 完成 设计 的 多 少 。 


6.3.2 粒度 

划分 中 的 第 二 个 问题 就 是 把 输入 的 功能 对 象 分 解 成 为 多 大 的 粒度 。 如 前 文 所 述 ,描述 首 
先 将 被 分 解 为 功能 对 象 ,然后 再 在 系统 组 件 间 进 行 划分 。 所 谓 分 解 的 粒度 ,就 是 每 个 对 象 中 所 
含 描述 规模 的 度量 。 粗 粒 度 意味 着 每 个 对 象 中 含有 大 量 描述 ,而 细 粒 度 则 表示 对 象 中 仪 含有 
少量 描述 ,从 而 具有 较 多 的 对 象 。 

对 于 特定 抽象 级 别 的 输入 ,只 有 一 种 分 解 粒度 较为 合理 。 比 如 任务 级 数据 流 图 通常 分 解 
为 任务 级 ,而 算法 级 数据 流 图 一 般 则 分 解 为 算法 操作 级 。 

任务 输入 抽象 级 的 分 解 具有 较 大 的 灵 伙 性 。 既 可 以 只 考虑 任务 本 身 ,又 可 以 将 任务 分 解 





系统 划分 99 


为 多 个 过 程 ,还 可 以 将 任务 和 过 程 进一步 分 解 为 if-then-else 或 者 loop 循环 体 之 类 的 语句 块 。 


此 外 ,甚至 还 可 以 将 每 个 语句 单独 考虑 。 

显然 ,对 输入 分 解 的 粒度 越 细 , 就 能 获得 更 多 的 划分 结果 ,也 就 能 获得 更 好 的 优化 结果 。 
然而 细 粒 度 也 有 着 一 些 缺 点 。 首 先 细 粒度 分 解 导 致 划分 对 象 增多 , 这 使 得 划分 算法 需要 更 多 
的 时 间 进 行 计算 ,否则 得 到 的 结果 会 不 理想 。 其 次 ,设计 者 不 容易 辨识 细 粒 度 对 象 ,因此 也 就 
难于 支持 手动 交互 。 再 次 , 细 粒 度 划 分 的 结果 对 设计 者 来 说 不 易 理解 ,对 其 进行 手动 设计 或 修 
改 都 较 困 难 。 最 后 ,对 系统 的 评估 也 较 困 难 。 

为 了 理解 低 粒度 下 评估 的 困难 性 ,下面 来 看 划分 中 这 个 硬件 面积 评估 的 例子 。 假 设 有 一 
个 精确 的 评估 算法 ,其 计算 复杂 度 为 Oln?) EP 为 算法 操作 的 数量 。 如 果 在 操作 级 别 较 
低 的 层次 上 进行 划分 ,假设 共有 10 000 个 操作 ,那么 对 每 次 划分 结果 进行 面积 评估 就 需要 
100 000 000 次 计算 。 如 果 需 要 进行 多 次 划分 并 进行 评估 的 话 , 这 种 计算 量 显然 是 不 现实 的 。 





相反 ,如果 在 较 高 级 别 上 进行 划分 ,就 能 在 划分 之 前 对 每 个 任务 使 用 该 算法 进行 评 佑 。 虽 然 评 


估 的 计算 复杂 度 很 高 ,但 只 允许 一 次 。 评 佑 的 结果 是 获得 每 个 任务 所 需 面积 的 佑 计 值 ,也 许 还 
有 更 多 的 面积 信息 ,这 将 在 7.5.4 节 中 进行 进一步 讨论 。 对 于 给 定 任务 级 划分 的 面积 评估 ,只 
需要 对 其 中 每 个 任务 的 评估 进行 合并 即 可 。 这 和 对 每 次 划分 都 在 操作 级 进行 评估 相 比 ,显然 
要 简单 得 多 了 。 


6.3.3 系统 组 件 的 分 配 

划分 技术 必须 指定 功能 对 象 映 射 到 的 系统 组 件 类 型 。 一 些 通用 组 件 包 括 处 理 般 、ASIC、 
存储 器 .寄存 器 文件 .数据 通路 和 总 线 等 。 

系统 组 件 的 分 配 就 是 对 一 个 给 定 的 设计 ,在 允许 的 系统 组 件 类 型 里 选择 一 些 , 并 确定 各 类 
组 件 所 需 的 数量 。 这 种 选择 组 件 的 过 程 就 叫做 分 配 (allocation)。 为 实现 一 个 给 定 的 描述 ,有 
着 多 种 不 同 的 分 配方 案 , 它 们 在 成 本 、 性 能 方面 各 有 不 同 。 此 外 还 需 考 虑 功 耗 设计 时 间 和 厂 
商 的 可 靠 性 等 问题 。 分 配 通 常 由 手动 完成 ,或 者 结合 划分 算法 共同 完成 。 


6.3.4 度量 和 评估 

每 种 划分 技术 都 需要 定义 一 些 划 分 的 属性 ,来 评价 划分 结果 的 好 坏 ,这 些 属性 就 称 做 度量 
(metrics)。 常 用 的 度量 有 成 本 、 执 行 时 间 、 通 信 比 特 率 、 功 耗 . 面 积 . 引 脚 、 可 测试 性 、 可 靠 性 、 程 
序 大 小 数据 大 小 ,以 及 存储 器 大 小 等 。 

一 些 技 术 每 次 只 组 合 一 -个 对 象 ,直到 得 到 完整 的 划分 。 由 于 上 面 提 到 的 度量 都 是 对 完整 
划分 提出 的 ,对 于 这 类 划分 技术 就 需要 一 些 新 的 度量 ,来 预测 任意 两 个 对 象 所 做 的 组 合 是 好 是 
坏 , 这 些 度量 称 做 接近 度量 (closeness metrics)。 如 一 个 结构 对 象 和 一 组 特定 的 结构 对 象 有 很 
多 互联 线 ,那么 它们 的 关系 就 比较 密切 。 如 果 一 个 任务 和 一 个 任务 组 共享 较 多 变量 ,那么 它们 
的 关系 也 比较 密切 。 有 关 接 近 度量 的 详细 讨论 请 参见 6.5.2 节 、6.5.3 节 和 6.7.3 节 。 | 

度量 的 值 必须 通过 某 种 方法 来 计算 ,但 这 并 不 是 太 容 易 。 这 是 由 于 所 有 度量 都 是 根据 实 
现 功能 对 象 的 结构 (或 软件 ) 来 建立 的 ,而 在 划分 中 这 些 实现 并 不 存在 。 要 计算 度量 ,可 以 采用 
下 面 的 两 种 方法 。 其 一 是 实际 实现 所 划分 的 系统 ,这 虽然 能 得 到 精确 的 度量 值 ,但 需要 花费 数 
天 以 至 数 月 的 时 间 来 实现 。 如 果 使 用 非 平凡 划分 算法 ,将 产生 成 千 上 万 种 划分 结果 ,这 些 结 末 
都 需要 进行 度量 ,对 这 种 情况 ,即使 具 需 要 儿 分 钟 来 建立 实现 ,所 需 的 时 间 也 是 无 法 忍受 的 。 

第 二 种 方案 是 粗略 地 快速 实现 系统 ,在 其 基础 上 计算 度量 值 。 粗 实现 包含 了 设计 中 主要 
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BS) ay FE ae Pe MARICE ,但 并 不 涉及 其 中 布线 或 逻辑 优化 等 耗 时 的 细节 。 通 过 这 种 粗 实 现 来 计 
算 度 量 值 就 叫做 评估 (estimation) ,在 下 一 章 里 将 对 评估 进行 详细 介绍 。 
评估 的 速度 和 精确 度 是 互相 矛盾 的 。 为 了 达到 较 快 的 速度 ,必然 会 忽略 粗 实 现 中 的 一 些 
细节 ;友之 为 了 达到 较 高 的 精度 则 必须 考虑 这 些 细 节 。 对 于 每 种 度量 ,都 有 不 同 的 实现 模型 ， 
在 不 同 程度 上 对 速度 和 精度 进行 折 中 。 
对 于 不 精确 的 评估 ,只 要 能 够 对 两 个 不 同 划 分 的 相对 好 坏 做 出 正确 的 判断 ,在 某 些 情况 下 
也 是 可 以 接受 的 。 评 估 所 具有 的 这 种 预测 两 个 划分 相对 好 坏 的 能 力 ,就 叫做 具有 高 保 真 度 (fi- 
delity ) 。 
值得 注意 的 是 ,划分 的 输入 描述 抽象 程度 越 低 , 评 估 的 结果 就 越 精确 。 这 是 因为 评估 会 去 
预测 后 续 设 计 步 又 的 结果 ,而 低层 描述 的 后 续 设计 和 高 层 描 述 相 比 会 少 得 多 ,从 而 能 避免 过 多 
错误 的 预测 。 
6.3.5 “目标 函数 和 接近 函数 
划分 通常 使 用 多 种 不 同 的 度量 ,如 费用 、 性 能 和 功率 ,这 些 度量 往往 是 相互 矛盾 的 。 为 了 
定义 划分 结果 的 好 坏 ,需要 把 多 种 度量 组 合成 一 个 函数 , 称 为 目标 函数 (objective function) ,其 
PRAUBE N ARA (cost) o 
由 于 各 种 度量 的 重要 性 不 同 ,如 何 将 多 种 度量 组 合成 上 个 值 也 是 一 个 重要 的 问题 。 多 数 
方法 使 用 加 权 和 目标 函数 , 即 用 权重 来 表示 各 个 度量 的 相对 重要 性 ,将 度量 值 和 其 权重 的 乘积 
和 作为 目标 函数 的 函数 值 。 一 个 加 权 和 目标 函数 的 例子 如 下 所 示 : 
Obj fet = k,* area + Ro* delay + k3° power (6-1) 
这 个 函数 包含 有 面积 (area) .时 延 (delay) 和 功率 (power) 三 个 度量 值 ,其 权重 分 别 为 上 li、&z 
和 a, 其 和 为 目标 函数 值 。 如 果 ki E k M k 大 ,就 意味 着 面积 比 其 他 两 个 度量 更 重要 。 
由 于 多 数 设计 决策 都 是 受 约束 的 驱动 ,实际 上 很 少 使 用 公式 (6-1) 那 样 的 简单 方程 。 在 目 
标 函 数 里 必须 加 入 约束 ,这样 得 出 的 划分 结果 和 不 加 约束 的 结果 相 比 ,能 更 好 地 满足 约束 的 要 
求 。 如 上 述 目标 函数 可 以 扩充 为 下 面 的 形式 : 
Obj fct = k; FC area ,area _constr ) 
+ k5* F( delay, delay _ constr ) 
+ k3*F( power , power _ constr ) (6-2) 
式 中 的 函数 下 表明 了 度量 的 估计 和 给 定 约束 之 间 的 关系 ,通常 在 不 满足 约束 的 时 候 返 回 非 零 
值 ,而 在 满足 约束 的 时 候 则 返回 零 。 因 此 ,即使 两 种 划分 结果 的 功率 不 一 样 , 只 要 它们 都 满足 
功率 的 约束 ,那么 在 对 比 这 两 种 划分 的 时 候 功 率 就 不 起 作用 。 当 各 种 约束 都 满足 的 时 候 , 这 种 
形式 的 函数 F 使 得 目标 函数 返回 零 , 于 是 划分 的 目标 就 是 获得 成 本 为 零 的 划分 方案 。 
组 合 各 种 度量 的 另 一 个 问题 就 是 各 个 度量 单位 的 归 一 化 。 比 如 面积 的 约束 是 9 000 个 面 
积 单位 ,评估 的 结果 可 能 是 10 000 个 面积 单位 ;而 时 延 的 约束 是 1 个 时 间 单 位 ,评估 的 的 结 采 
为 10 个 时 间 单 位 。 假 设 目 标 函 数 中 的 各 个 系数 & 都 相同 ,那么 应 该 更 看 重 减 小 时 延 而 不 是 
面积 ,因为 时 延 的 评估 结果 是 其 约束 的 10 倍 。 特 别 地 ,时 延 减少 5 个 时 间 单 位 比 面积 减 小 5 
个 单位 要 好 得 多 ,因为 前 者 减 小 了 50% 的 时 延 ,而 后 者 仅仅 减少 了 1% 的 面积 。 如 果 将 每 个 函 
数 下 的 值 除 以 其 度量 约束 值 ,就 能 够 很 清楚 地 看 出 前 者 的 优势 所 在 了。 
一 方面 自 标 函数 将 各 个 度量 结合 在 一 起 ,来 评价 划分 的 结果 ;而 另 一 方面 ,接近 骂 数 
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(closeness function) 将 关系 紧密 的 度量 结合 在 一 起 ,在 完成 整个 划分 以 前 来 衡量 是 否 需 要 将 对 
象 合 为 一 组 。 权 重 和 目标 函数 的 归 一 化 这 些 讨 论 同样 也 适用 于 接近 取 数 。 


6.3.6 划分 算法 

对 于 给 定 的 一 组 功能 对 象 和 系统 组 件 , 划 分 算法 将 搜索 最 好 的 划分 方案 ,最 好 意味 着 该 方 
案 的 目标 函数 具有 最 小 的 成 本 。 

显然 ,通过 穷 举 法 产生 所 有 可 能 的 划分 方案 ,然后 对 每 个 方案 的 目标 图 数值 进行 计算 ,就 
可 以 得 到 最 优 解 。 然 而 这 种 方法 计算 量 太 大 ,没有 实际 意义 。 假 设 有 n NIZM m 个 组 件 ， 
就 有 m” 种 可 能 的 上 映射。 考虑 一 个 较 小 的 规模 , 当 交 =20、 =4 时 ,有 一 万 多 亿 种 映射 结果 。 
这 决定 了 划分 算法 的 核心 , 即 如 何在 所 有 可 能 划分 情况 中 选取 一 个 子 集 来 进行 检测 。 

划分 算法 通常 可 以 分 为 两 类 , 即 构造 性 算法 和 迭代 算法 。 构 造 性 算法 将 全 部 对 象 分 组 来 
获得 整个 划分 ,并 使 用 接近 上 度量 来 指导 对 象 的 分 组 ,从 而 多 得 较 好 的 划分 结果 。 构 造 性 算法 的 
计算 时 间 主 要 用 于 构造 这 些 数量 较 少 的 划分 。 


迁 代 算法 需要 对 已 有 的 划分 结果 进行 修改 ,以 期 望 得 A 
到 改善 ,并 通过 目标 函数 来 对 划分 进行 评价 ,这 样 得 到 的 结 “成 本 人 B 
果 比 构造 性 算法 中 的 接近 函数 要 精确 得 多 。 迁 代 算 法 的 计 ae 


算 时 间 主 要 用 于 评价 大 量 的 划分 方案 。 选 代 算法 和 构造 性 
算法 相 比 ,主要 区 别 在 于 如 何 修改 已 有 的 划分 ,以 及 如 何 接 
受 或 拒绝 较 坏 的 修改 。 为 了 尽 可 能 减少 计算 量 , 在 搜索 过 图 62 {Valores 
程 中 需要 逃 逸 出 局 部 最 小 点 。 图 6-2 给 出 了 一 系列 解 的 移 出 局 部 最 小 所 
动 和 每 次 移动 后 的 成 本 值 , 由 此 来 说 明 局 部 最 小 点 的 概念 。 对 划分 来 说 ,移动 就 是 对 已 有 结 
进行 修改 ,并 将 重新 对 象 映 射 到 不 同 的 组 件 上 。 在 图 6-2 中 ,最 左边 一 个 点 代表 初始 划分 的 成 
本 ,前 两 次 移动 都 使 得 成 本 有 所 降低 ,达到 点 A。 接 着 的 两 次 移动 虽然 增 大 了 成 本 ,但 其 后 续 
将 移 至 成 本 更 小 的 点 B。 这 里 点 A 就 是 一 个 局 部 最 小 (local minimum) A, iA B 则 是 全 局 最 
小 点 。 一 类 人 迭代 算法 在 搜索 中 只 接受 比 当前 成 本 更 低 的 解 ,这 类 算法 称 为 贪心 算法 (greedy 
algorithm) ,这 类 算法 无 法 逃 出 局 部 最 小 点 ;而 另 一 类 算法 则 能 逃 出 局 部 最 小 ,通常 称 为 息 山 算 
法 (hill-climbing algorithm) o 

在 实际 使 用 中 ,经 常 将 构造 性 算法 和 迭代 算法 结合 起 来 。 我 们 将 在 6.4 节 里 对 基本 划分 
算法 进行 进一步 阐述 。 
6.3.7 输出 

每 种 划分 技术 都 必须 定义 其 输出 的 表示 格式 和 可 能 应 用 。 格 式 可 以 是 一 个 列表 ,指示 每 
个 功能 对 象 映 射 到 了 哪个 系统 组 件 上 ;也 可 以 是 另 一 种 新 的 输入 描述 ,含有 系统 组 件 的 结构 对 
象 ,并 通过 功能 对 象 的 映射 关系 来 定义 组 件 的 功能 。 输 出 的 可 能 应 用 描述 了 输出 信息 在 后 续 
设计 过 程 中 所 扮演 的 角色 。 例 如 输出 可 以 作为 功能 描述 提供 给 设计 者 ,来 完成 每 个 组 件 的 具 
体 实现 ,也 可 以 作为 综合 工具 的 输入 ,甚至 给 综合 工具 提供 启发 式 信息 ,来 帮助 综合 工具 选取 
言 息 中 的 有 用 部 分 。 
6.3.8 控制 流程 和 设计 者 的 参与 

通过 上 述 讨 论 可 以 看 到 ,对 于 一 个 给 定 的 描述 ,要 对 其 中 的 系统 组 件 进行 划分 ,需要 做 出 
很 多 的 决定 ,包括 选择 对 象 的 粒度 .分配 系统 组 件 .选择 质量 度量 .选择 目标 函数 或 接近 函数 以 
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及 选择 划分 算法 等 。 这 些 决定 可 以 根据 上 述 顺 序 或 者 其 他 顺序 来 执行 ,其 中 某 些 决 定 需 要 多 


次 执行 。 比 如 可 以 用 下 面 的 顺序 来 完成 整个 流程 :选择 粒度 .选择 接近 度量 .选择 接近 承 数 .分 
配 组 件 ,执行 构造 性 划分 算法 .重新 选择 其 他 的 接近 函数 .重新 执行 构造 性 划分 算法 .选择 目标 
函数 .执行 迭代 划分 算法 、 重 新 分 配 系 统 组 件 、 重 新 执行 迭代 划分 算法 。 整 个 过 程 的 控制 流程 
可 以 不 同 。 不 同 的 顺序 会 导致 不 同 的 结果 ,因此 划分 技术 必须 指明 这 些 决 定 的 顺序 ,以 此 在 特 
定 设计 目标 (如 性 能 最 优 ) 下 得 到 一 个 较 好 的 结 采 。 

在 实际 应 用 中 ,划分 系统 必须 允许 设计 者 的 交互 。 交 互 可 以 分 为 两 类 。 一 类 是 指示 THI 
了 设计 者 可 以 手动 执行 的 动作 ,如 分 配 ,将 指定 对 象 移动 到 指定 组 件 上 ,将 评 佑 蔡 换 为 更 好 的 
评估 等 。 第 二 类 交互 是 反馈 ,描述 了 当前 设计 提供 给 设计 者 的 信息 。 比 如 一 个 图 可 以 表示 对 
象 间 的 连 线 数目 ,直方 图 可 以 表示 设计 约束 的 不 满足 程度 。 


6.3.9 典型 系统 配置 

图 6-3 中 描述 了 一 个 可 执行 描述 的 划分 系统 的 典 
型 配置 。 输 入 (input) 被 转换 为 划分 的 内 部 模型 (mod- 
el) ,二 者 在 功能 上 完全 等 价 , 该 模型 将 用 于 之 后 的 划 
分 算法 (algorithm)。 划 分 算法 需要 评估 器 (estimator) 
和 目标 函数 (objective function) ,其 中 评估 器 对 模型 进 
行 计算 ,并 将 结果 传递 给 目标 函数 ; 目标 图 数 用 于 评 
估 。 划 分 模型 会 被 转换 为 输出 (output), 以 适应 后 续 
的 设计 和 分 析 。 后 续 实 现 中 获得 的 各 种 度量 也 叫做 设 
计 反 馈 (design feedback) ,可 以 在 后 续 划 分 中 用 以 提高 
设计 质量 。 设 计 者 可 以 通过 用 户 接 口 (user interface) 
来 和 系统 中 的 不 同 部 分 进行 交互 。 ”图 6-3 划分 系统 的 典型 配置 


6.4 基本 划分 算法 


划分 算法 将 每 一 个 功能 对 象 映 射 到 一 个 组 上 ,每 
组 代表 一 个 系统 组 件 。 从 理论 上 来 说 ,算法 产生 的 划分 结果 能 使 目标 函数 获得 最 小 成 本 。 形 
式 化 的 划分 问题 定义 如 下 所 示 : 

定义 6.4.1: 划分 问题 

给 定 一 个 目标 集合 O = 101,02,… ,0n1, 求 划分 1p1,p2，,… Pm ,使 其 满足 pi U p2U 
epa =0, YiÆj, pp = O JHE H tr BR Ohi PRAM. 

接 下 来 将 讨论 随机 映射 .层次 化 结 群 .多 级 结 群 .成 组 移动 .比率 切割 .模拟 退火 .遗传 进化 
和 整数 线性 规划 等 多 种 划分 算法 。 


6.4.1 PELIAS 

一 种 常用 的 构造 性 算法 是 随机 映射 , 它 把 每 个 对 象 随 机 地 和 给 定 的 组 件 进行 搭配 。 这 种 
算法 通常 用 来 获得 迭代 算法 的 初始 划分 。 其 计算 复杂 度 为 Oln), EP 为 对 象 数量 。 
6.4.2 层次 化 结 群 


层次 化 结 群 是 一 类 常用 的 构造 性 划分 算法 [Job67， LT91, MK90, CB87, GDWL91], 
使 用 接近 度量 来 将 对 象 进行 分 组 ,因为 其 他 度量 无 法 在 划分 完成 以 前 得 到 其 值 。 3| 人 接近 度 








系统 划分 103 


量 是 为 了 获得 一 个 好 的 全 局 度量 值 。 这 种 方法 将 关系 密切 的 对 象 进 行 组 合 , 然 后 重新 计算 组 
合 后 的 接近 性 ,并 重复 该 操作 直到 满足 终止 条 件 为 止 。 

算法 6.4.1 使 用 6.4.1 中 定义 的 标记 ,详细 描述 了 一 个 层次 化 结 群 算法 。 算 法 中 的 过 程 
ComputeCloseness 用 来 计算 两 个 对 象 o; 和 o; 之 间 的 接近 性 ,计算 结果 保存 在 集合 C 的 元 素 
cj 中 。 对 初始 对 象 ,ComputeCloseness 根据 6.3.5 节 中 描述 的 接近 郴 数 来 确定 其 接近 性 。 然 
而 对 于 组 合 后 的 层次 化 对 象 ,有 多 种 方法 来 计算 其 接近 性 。 一 种 方法 是 使 用 接近 函数 ,但 是 反 
复 调 用 该 函数 需要 大 量 的 计算 ; 另 一 种 方法 是 估计 层次 化 对 象 oj 和 o 间 的 接近 性 ,并 将 其 作 
为 cx 和 cx 之 间 的 最 小 .最 大 .平均 或 是 总 接近 性 。 

过 程 FindClosestObjects 搜索 给 定 集合 中 接近 性 最 高 的 一 对 对 象 ;过 程 Terminate 在 算法 
结束 的 时 候 返 回 真 值 。Terminate 的 一 种 普遍 形式 是 在 所 有 对 象 都 组 合 到 了 一 定数 量 的 组 后 
返回 真 , 另 一 种 形式 是 当 所 有 接近 性 的 值 都 低 于 某 一 数值 时 返回 真 ,这 个 特定 的 数值 叫做 接近 
HE 139 {2 (closeness threshold) o 

算法 6.4.1: 层次 化 结 群 


/x 初始 化 ,将 每 个 对 象 作为 一 组 * / 
for 每 一 个 o loop 

Pi ~ O; 

P=PU p; 
end loop 


/x 计算 对 象 间 的 接近 度 * / 
for 每 一 个 P; loop 
for 每 一 个 p; loop 
Ci,j = ComputeCloseness( p; , p;) 
C= CU c; 
end loop 


end loop 


/* 合并 关系 密切 的 对 象 ,并 重新 计算 接近 度 * / 
while not Terminate(P) loop 

pi, p; = FindClosestObjects(P, C) 

P= P- p> pU P; 

for 每 一 个 pk loop 

ci 二 ComputeCloseness(p,;, pa) 

end loop 

end loop 


return P | 

算法 的 开始 是 初始 化 ,将 每 一 个 对 象 都 作为 一 组 ,然后 计算 每 一 对 对 象 间 的 接近 性 。 算 法 
的 核心 部 分 是 将 接近 对 象 合并 成 一 个 新 的 对 象 (实际 上 是 一 组 ) ,然后 重新 计算 这 个 新 对 象 和 
其 他 每 一 个 对 象 间 的 接近 性 。 这 个 核心 部 分 将 重复 执行 ,直到 满足 终止 条 件 为 止 。 算 法 的 复 
杂 度 主要 由 计算 对 象 对 间 的 接近 性 决定 ,为 O(n”“)。 
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”图 6-4 层次 化 结 群 


下 面 来 看 图 6-4 中 的 例子 ,该 例 含 有 4 个 对 象 o .os、o3 和 o4 ,它们 两 两 间 的 接近 性 值 均 
标 在 图 中 。 从 图 6-4a 中 可 以 看 到 对 象 ot 和 oz 关系 最 密切 ,其 接近 值 为 30。 于 是 将 ol 和 op 
合并 为 一 个 新 的 对 象 ,并 计算 合并 之 前 这 两 个 对 象 和 图 中 其 他 对 象 接 近 值 的 平均 值 ,作为 新 对 
象 与 其 他 对 象 的 接近 值 的 估计 值 , 得 到 图 6-4b。 接 着 用 同样 的 处 理 方法 进行 合并 、 计 算 ,可 以 
得 到 图 6-4c。 假 设 算法 终止 的 条 件 是 任意 两 个 对 象 间 的 接近 性 都 不 超过 阔 值 1$ ,那么 得 到 的 
最 终 划 分 结果 是 ol .os 和 03 属于 一 组 ,而 o4 属于 另 一 组 ,如 图 6-4c PTR o 

为 了 保留 对 象 合并 的 顺序 ,我 们 可 以 对 算法 进行 修改 来 生成 结 群 树 (cluster tree) ,再 进行 
结 群 操作 ,直到 系统 中 只 剩 一 组 为 止 。 通 过 合并 的 记录 可 以 产生 多 种 可 能 的 划分 结果 。 还 是 
以 图 6-4 为 例 , 图 6-4a 中 的 所 有 对 象 01.02.03 和 04 都 作为 结 群 树 的 叶子 结 点 。 在 图 6-4b 
中 , 当 oj 和 on 合并 成 新 的 对 象 时 ,相应 地 在 树 中 为 这 两 个 结 点 增加 一 个 父 结 点 ,来 代表 合并 
后 的 新 对 象 。 在 图 6-4c 中 ,上 步 生 成 的 新 对 象 和 o3 进行 合并 ,于 是 在 树 中 为 其 再 增加 一 个 父 
结 点 。 当 合并 最 后 一 个 对 象 o, 时 ,增加 的 父 结 点 就 是 整个 结 群 树 的 根 结 点 。 对 上 述 例子 , 整 
个 结 群 树 如 图 6-4d 所 示 。 如 果 在 结 群 树 中 做 一 条 水 平 线 ,对 树 进行 切割 ,就 可 以 得 到 一 个 划 
分 。 比 如 在 第 二 级 结 点 上 做 一 条 水 平 线 ,如 图 6-5a 所 示 ,就 可 以 得 到 一 个 划分 ,将 ol 和 oz 分 
为 一 组 ,os Flog 各 自 为 一 组 。 这 样 的 线 就 叫做 切割 线 (cutline), 它 可 以 位 于 结 群 树 中 joe 
a If AT LA HELTER PAR TAS EIR, BP a a 
都 包含 有 若 于 个 组 ,而 每 组 都 由 一 些 关 系 密切 的 对 象 组 成 。 


6.4.3 多 级 结 群 

我 们 可 以 看 到 ,在 层次 化 结 群 里 ,多 个 接近 度量 会 被 合并 成 一 个 单一 接近 值 。 当 有 多 个 接 
近 度 量 时 ,一 种 较 好 的 做 法 是 由 一 个 度量 开始 进行 层次 化 结 群 ,然后 再 考虑 其 他 度量 。 每 次 根 
据 一 个 度量 进行 的 结 群 过 程 称 为 一 级 。 可 以 使 用 任意 数量 的 级 数 。 这 种 处 理 方法 被 称 为 多 级 
结 群 (multi-stage clustering) ,详细 介绍 请 参见 [LT91j。 

图 6-5 中 描述 了 一 个 两 级 结 群 。 图 6-5a 中 是 上 一 节 例 子 中 的 结 群 树 ,切割 线 表 明了 系统 
中 共有 三 个 组 ,这 些 组 在 后 续 的 结 群 中 都 被 看 做 新 的 对 象 , 如 图 6-5b 所 示 。 在 新 的 一 级 中 ,我 
们 使 用 和 上 一 级 不 同 的 度量 来 重新 计算 对 象 间 的 接近 值 ,并 重复 此 操作 ,从 而 得 到 新 的 结 群 
树 , 如 图 6-5c 所 示 。 | 

每 一 级 都 含有 一 个 新 的 层次 化 结 群 过 程 ,其 复杂 度 为 O(n?*)。 由 于 级 数 为 一 个 较 小 的 
数 , 因 此 将 层次 化 结 群 的 复杂 度 乘 以 一 个 较 小 的 常数 ,就 可 以 得 到 多 级 结 群 的 理论 复杂 度 ,为 
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O(n’)。 
结 群 和 随机 映射 一 样 ,其 迭代 改进 算法 都 需要 一 个 初始 划分 ,因此 必须 选择 一 个 构造 性 算 
法 。 如 果 迭 代 算 法 效果 很 好 ,最 后 结果 和 构造 性 算法 的 选择 关系 就 不 大 。 在 这 种 情况 下 ,建议 使 (190| 
用 随机 映射 ,因为 它 和 结 群 相 比 计算 量 要 少 。 某 些 实验 结果 表明 , 结 群 和 随机 映射 相 比 会 导致 更 
坏 的 结果 ,这 是 因为 结 群 所 得 的 划分 是 一 个 局 部 最 小 点 ,而 迭代 算法 无 法 逃 出 这 个 局 部 最 小 。 然 
而 为 外 一 些 实验 结果 表明 ,在 对 象 数 目 较 大 的 时 候 , 结 群 能 从 很 大 程度 上 改善 最 终结 果 。 


om | 
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图 6-5 多 级 层次 化 结 群 


6.4.4 成 组 移动 

这 种 迭代 改善 算法 通常 也 叫做 最 小 割 或 者 Kernighan/Lin 算法 ,是 为 了 改善 二 路 划分 的 
结果 而 提出 的 [KL70], 而 且 经 过 修改 来 减少 其 计算 量 [FM82 ] 并 获得 更 好 的 结果 [LKri84]。 该 
算法 的 原形 是 最 小 化 组 之 间 的 连 线 数 量 , 即 制 值 ,因此 被 称 为 "最 小 割 “ 算 法。 后 来 ,该 算法 引 
入 了 割 以 外 的 其 他 多 种 度量 。 该 算法 的 控制 策略 已 经 对 结构 划分 得 到 了 很 好 的 结案 ,并 且 能 
同样 在 功能 划分 中 取得 成 功 。 . 

下 面 将 通过 对 简单 二 路 划分 算法 进行 扩展 ,来 说 明 该 算法 的 控制 策略 。 二 路 划分 重复 执 
行 如 下 步骤 ;对 每 个 对 象 ,计算 将 其 移动 到 另 一 组 而 引起 的 成 本 减少 量 ,然后 选取 减少 量 最 多 Wl 
的 对 象 ,将 其 移动 到 另 一 组 。 在 某 些 情况 下 ,移动 一 个 对 象 并 不 能 减少 成 本 ,但 后 续 的 两 步 或 
者 多 步 移动 后 可 能 会 使 成 本 减少 。 该 算法 无 法 对 这 类 情况 进行 处 理 ,也 就 是 说 该 算法 无 法 逃 
出 局 部 最 小 点 。 

成 组 移动 对 上 述 算法 进行 扩展 ,在 移动 的 时 候选 择 成 本 减少 量 最 大 或 者 是 成 本 增加 量 最 
少 的 对 象 , 这 样 就 可 以 逃 出 局 部 最 小 。 为 了 避免 某 个 对 象 在 两 组 之 间 反 复 移动 造成 算法 中 出 
现 无 限 循环 ,每 个 对 象 都 只 能 移动 一 次 。 在 每 个 对 象 都 移动 一 次 后 ,就 可 以 在 计算 中 所 得 到 的 
所 有 划分 中 选取 成 本 最 低 的 作为 最 终结 果 。 

整个 算法 使 用 这 个 新 的 划分 作为 初始 划分 进行 迭代 , 直到 无 法 得 到 成 本 更 低 的 划分 为 止 。 
根据 实验 结果 ,该 过 程 重复 次 数 一 般 不 超过 5 次 LKL70j。 

算法 6.4.2 对 改善 二 路 划分 的 成 组 移动 做 了 详细 描述 。 其 中 算法 的 输入 为 P _in= ips 
p>} ,函数 Move(P，o;) 将 对 象 o; 移动 到 另 一 组 ,并 返回 新 的 划分 。 每 个 对 象 o 都 有 一 个 标 
志 moved ,用 来 标明 该 对 象 是 否 移动 过 ,每 个 对 象 只 能 移动 一 次 。 变 量 prev _P MM prev _cost 
分 别 代表 在 迭代 的 每 一 步 中 ,移动 之 前 的 划分 和 成 本 。 变 量 bestmove _ obj 代表 移动 后 能 带 来 
最 大 成 本 降低 的 对 象 , 相 应 的 成 本 用 bestmove _ cost HAA. EE bestpart _P 代表 计算 过 程 
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中 遇 到 的 成 本 最 低 的 划分 ， best part _ cost 为 该 划分 的 成 本 。 

当 产 生 的 移动 无 法 改善 成 本 的 时 候 , 算 法 的 最 外 层 循环 将 停止 。 在 每 次 迭代 中 ,都 要 建立 一 个 
n 步 的 移动 序列 ,其 中 ”是 对 象 数目 。 对 序列 中 的 每 一 步 移动 ,都 要 试 着 将 每 个 对 象 移 到 另 一 组 ， 
选 出 能 获得 最 好 结果 的 一 个 ,并 对 其 进行 标记 以 免 再 次 移动 。 如 采 移 动 后 的 成 本 比 以 往 的 都 好 , 束 
需要 记录 这 个 结果 和 成 本 。 在 得 到 所 有 的 n 步 移 动 后 ,对 保存 的 最 优 划 分 和 迭代 初始 划分 进行 对 
比 。 如 果 保 存 的 划分 较 优 ,那么 就 进行 下 一 轮 和 迭代 ;否则 仍 使 用 上 次 的 划分 结果 。 

算法 6.4.2: 成 组 移动 


P= P_in 

loop 
“初始 化 * / 
prev_P = P 


prev_ cost = Objfct(P) 

bestpart _ cost = co 

for 每 一 个 ol loop 
o;.moved = false 


end loop 


/x 建立 一 个 nm 步 移动 的 序列 * / 
for i 从 1 2 n loop 
bestmove cost = © 
for 每 一 个 没有 移动 过 的 o; loop 
cost = Objfct(Move(P, 0; ) ) 
if cost < bestmove _ cost then 
bestmove _ cost = cost 
bestmove _ obj = 0; 
end if 
end loop 
P = Move(P, bestmove _ obj) 
bestmove _ obj. moved = true 
/x 保存 序列 中 的 最 优 划 分 结果 x* / 
if bestmove _ cost < bestpart _ cost then 
bestpart P = P 
bestpart _ cost = bestmove _ cost 
end if 


end loop 


/x 如 果 找 到 更 优 的 解 则 更 新 P, 否 则 退出 */ 
if bestpart _ cost < prev _ cost then 
P = bestpart _ P 
else return prev _ P 
end if 


end loop 
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BAL YS ALOE A En 步 移动 所 决定 。 对 每 一 次 移动 都 需要 选择 一 个 最 优 对 象 , 这 平 
均 需要 对 n2 个 对 象 进 行 检验 。 假 设 目标 函数 需要 的 计算 量 的 数量 级 也 是 n ,那么 算法 的 复 


未 度 就 为 O(2xza2xn), 即 O(P)。7.5.4 节 将 详细 讨论 一 种 增 量 式 评估 技术 ,将 目标 函 


数 的 复杂 度 降 为 常数 。 由 于 成 组 移动 每 次 只 移动 一 个 对 象 ,如 果 采 用 增 量 式 评估 技术 ( 见 
7.5.4 市 ), 就 可 以 使 得 目标 消 数 的 计算 复杂 度 降 低 为 常数 ,因而 整个 算法 的 复杂 度 可 以 降 为 
O(n”)。 文 献 [FM82] 针 对 结构 划分 对 该 算法 进行 了 优化 ,使 其 复杂 度 进一步 降 为 O(n). 

上 述 算法 很 容易 扩展 为 多 路 划分 。 在 二 路 划分 中 ,为 了 得 到 最 优 对 象 ,需要 试 着 将 每 个 对 
象 都 移动 到 另 一 组 ,然后 选 出 其 成 本 最 低 的 对 象 ;而 在 多 路 划分 中 ,需要 将 每 个 对 象 都 移动 到 
其 余 的 每 一 组 。 于 是 需要 引入 一 个 新 的 变量 bestmove _ group ,来 指明 最 好 的 移动 方案 中 对 象 
会 移动 到 那 一 组 里 。 算 法 的 复杂 度 将 乘 以 组 数 。 假 设 对 于 二 路 划分 的 算法 复杂 度 为 O(n’), 
那么 对 多 路 划分 的 算法 复杂 度 将 变 为 Omn), AP m 为 划分 的 组 数 。 

在 多 路 划分 的 另 一 种 扩展 方案 中 , 先 根据 二 路 划分 的 算法 生成 两 组 ,然后 再 使 用 二 路 划分 
算法 ,将 其 中 每 组 都 继续 划分 成 两 组 。 如 此 重复 ,直到 划分 的 组 数 满足 要 求 为 止 。 由 于 划分 的 
组 数 m 一 定 , 因 此 该 算法 的 复杂 度 也 为 O( mn"). 


6.4.5 比率 切割 

比率 切割 也 是 一 种 构造 性 算法 ,最初 是 针对 结构 划分 提出 的 ,对 于 对 象 数量 很 多 的 情况 有 
很 好 的 效果 。 下 面 介绍 该 算法 的 一 般 形 式 , 它 也 适用 于 功能 划分 。 该 算法 将 对 象 进行 分 组 , 直 
到 满足 终止 条 件 为 止 ,也 就 是 说 没有 对 象 被 认为 和 其 他 对 象 关系 足够 密切 的 时 候 才 结束 。 该 
终止 条 件 是 形成 自然 组 ,而 不 像 6.4.2 节 中 的 层次 化 结 群 算法 ,需要 指明 组 的 数量 或 者 是 接近 
HEBE 

这 种 新 的 终止 条 件 依赖 于 新 的 划分 度量 的 定义 ,这 种 度量 可 以 从 切割 数 扩展 而 得 ,切割 数 
就 是 穿越 一 组 边界 的 所 有 边 权 重 的 总 和 。 可 以 通过 组 的 切割 数 来 评估 划分 ,切割 数 越 小 ,就 意 
味 着 联系 密切 的 对 象 已 经 位 于 同一 组 里 。 然 而 ,如 果 只 有 切割 数 这 一 个 度量 ,那么 所 有 对 象 最 
终 合 为 一 组 ,而 不 管 对 象 间 的 关系 是 否 密 切 。 为 了 避免 这 种 情况 ,需要 对 一 组 里 含有 对 象 数 
目 , 即 组 的 规模 做 一 定 的 限制 ,但 这 种 限制 可 能 导致 无 法 获得 组 大 小 不 平衡 的 最 优 划分 。 基 于 
以 上 考虑 ,比率 切割 的 目标 就 是 将 对 象 进行 组 合 来 减 小 切割 数 ,但 不 合并 关系 不 密切 的 对 象 ， 
也 没有 组 大 小 的 限制 。 

为 了 达到 上 述 目标 ,这 里 用 一 个 新 的 度量 比率 (ratio) 来 代替 切割 数 。 对 划分 已 = p,, 
pal, S cut (了) 为 连接 p, 和 p, 的 边 的 权重 总 和 , size(p,) 和 size(p,) 分 别 表 示 p, 和 p, 的 大 
小 。 划 分 的 比率 定义 如 下 ,该 值 越 小 越 好 : 


cut(P) 
size( p,) X size(p,) (6-3) 





ratio = 


在 结 群 中 ,需要 组 合 对 象 以 减 小 切割 数 ,而 又 不 合并 关系 不 密切 的 对 象 , 比率 在 相互 矛盾 
的 两 方面 间 能 取得 平衡 。 其 中 分 子 倾向 于 组 合 对 象 ,组 间 的 边 权重 和 越 小 , cut (已 ) 也 就 越 小 ; 
分 母 则 用 来 维持 多 组 大 小 的 平衡 ,组 大 小 越 平衡 , size(p，) x size( p,) 就 越 大 。 

有 了 比率 这 个 新 的 度量 ,就 可 以 寻找 具有 最 小 度量 的 划分 ,这 种 划分 称 为 比率 切割 。 
[KC91] 中 提出 了 一 种 启发 式 的 算法 , 它 将 比率 直接 作为 目标 函数 ,首先 获得 初始 划分 ,然后 多 
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次 运用 成 组 移动 。 


6.4.6 模拟 退火 

在 6.4.4 节 中 我 们 可 以 看 到 ,如 果 接 受 成 本 增 大 的 移动 方案 ,成 组 移动 就 可 以 逃 出 局 部 最 
小 ,从 而 获得 成 本 更 低 的 划分 。 并 且 在 整个 序列 中 每 个 对 象 只 移动 一 次 ,降低 了 算法 的 计算 复 
末 度 。 模 拟 退 火 算 法 [KGV83] 同 样 接受 成 本 增加 的 移动 ,但 和 成 组 移动 不 同 的 是 ,模拟 退火 
中 每 个 对 象 可 以 移动 多 次 , 随 着 时 间 的 推移 ,接受 成 本 增加 的 移动 的 概率 逐渐 减 小 ,以 此 降低 
算法 的 复杂 度 。 算 法 模拟 物理 中 的 退火 过 程 ,就 是 将 材料 熔化 ,再 以 足够 慢 的 速度 降低 温度 ， 
这 样 在 每 个 温度 下 都 能 够 达到 平衡 状态 ,通过 这 种 方法 来 使 材料 达到 能 量 最 低 的 状态 。 

模拟 退火 算法 从 一 个 初始 划分 和 初始 模拟 温度 升 始 , 逐 渐 降 低温 度 。 在 每 个 温度 下 随机 
产生 移动 。 任 何 移 动 都 可 能 被 算法 所 接受 ,即使 该 移动 会 导致 成 本 上 升 ,但 接受 成 本 上 升 移动 
的 可 能 性 随 着 温度 的 降低 而 减 小 。 

算法 6.4.3 详细 描述 了 一 个 模拟 退火 算法 。 变 量 temp 记录 当前 的 模拟 温度 ; 函数 Ran- 
domMove 在 当前 划分 P 中 随机 选择 一 个 对 象 ,将 其 移动 到 另 一 组 ,产生 一 个 新 的 划分 P ten- 
tative ;变量 cost Fil cost _ tentative 分 别 为 当前 成 本 和 试探 划分 的 成 本 ;变量 Acos 用 来 保存 试 
探 划 分 和 当前 划分 的 成 本 差 , 可 能 为 负 值 ; 函数 Accept 根据 成 本 的 增加 值 和 当前 温度 ,由 下 式 
[KGV83] 来 判断 是 否 接受 该 移动 ; 


Accept (Acost ,temp) = min(1,e#? ) (6-4) 
当 Acost 为 负 时 ,意味 着 试探 划分 比 当 前 划分 更 好 , Accept 将 返回 1; 否 则 将 返回 一 个 位 于 [0， 
1] 间 的 值 ; 函数 Random (0, 1) 返 回 一 个 [0,1] 间 的 随机 数 ; 函 数 Equilibrium 判断 在 当前 温度 
下 ,划分 过 程 是 否 达到 平衡 ,如 果 多 次 选 代 都 不 能 改善 成 本 ,就 可 以 认为 已 经 达到 平衡 了 ;达到 
平衡 后 ,通过 函数 DecreaseTemp 来 降低 温度 ,通常 根据 temp _new =a X temp _old 来 确定 新 
的 温度 ,其 中 0< a <1; Frozen 确定 是 否 达到 最 低温 度 值 ,也 就 是 判断 算法 是 否 结束 ,其 
中 最 低温 度 通常 为 0。 
算法 6.4.3: 模拟 退火 
temp = 初始 温度 
cost = Objfct(P) 
while 没有 达到 最 低温 度 loop 
while 没有 平衡 loop 
P_ tentative = RandomMove(P) 
cost _ tentative = Objfct(P _ tentative) 





Acost = cost_ tentative 一 cost 
if (Accept(Acost, temp) > Random(0, 1)) then 
P = P_ tentative | 
cost = cost _ tentative 
end if 
end loop 
temp = DecreaseTemp( temp) 
end loop 


在 某 一 特定 温度 下 ,都 产生 随机 移动 并 选择 性 进行 接受 ,以 此 来 试 着 改善 划分 ,直到 达到 





系统 划分 109 


平衡 。 当 Accept 的 返回 值 大 于 Random (0, 1) 的 返回 值 时 ,接受 该 移动 。 阁 移动 对 划分 有 改 
善 ,那么 Accept 将 返回 1, 这 种 移动 一 定 能 被 接受 。 达 到 平衡 后 将 降低 温度 ,继续 执行 上 述 改 
善 步骤 ,直到 达到 最 低温 度 。 

理论 研究 [RSV85，Len90] 表 明 ,如 果 在 每 一 个 温度 下 都 达到 了 平衡 状态 ,并 且 温 度 降低 
速度 无 限 低 ,模拟 退火 算法 能 够 逃 出 局 部 最 小 点 ,并 最 终 到 达 全 局 最 小 点 。 但 这 需要 无 限 多 的 
温度 ,在 每 个 温度 下 也 需要 无 限 次 迭代 ,显然 是 不 现实 的 。 于 是 人 们 提出 了 许多 局 发 式 算 法 
[OvG84，HRSV86], 来 控制 模拟 退火 过 程 。 这 些 启 发 思想 定义 了 平衡 状态 以 及 如 何 降 低温 
度 。 算 法 复杂 度 依赖 于 Accept Equilibrium 、DecreaseTemp 和 Frozen 这 些 函 数 的 具体 形式 ， 
尽管 这 些 函 数 通 常 都 选用 多 项 式 复 杂 度 的 算法 [Len90], 但 整个 算法 的 复杂 度 仍 可 以 是 指数 
级 到 常数 级 间 的 多 种 形式 。 一 般 而 言 ,模拟 退火 能 获得 较 好 的 结果 ,但 需要 较 长 的 计算 时 间 。 


6.4.7 遗传 进化 

成 组 移动 和 模拟 退火 算法 都 通过 移动 一 定数 量 的 对 象 来 改善 当前 划分 ,保存 计算 过 程 中 
的 最 好 划分 ,并 以 这 个 最 好 划分 为 基础 继续 迭代 。 然 而 并 不 需要 将 计算 过 程 中 保存 的 划分 数 
量 限制 为 一 个 。 

有 一 类 算法 根据 遗传 进化 过 程 ,保存 迭代 过 程 中 的 一 系列 划分 结果 ,算法 中 的 这 一 系列 划 
分 也 称 为 一 代 。 遗 传 算法 在 某 一 代 的 基础 上 ,通过 模拟 自然 界 的 三 种 进化 方式 来 产生 下 一 代 。 
第 一 种 方法 是 选择 (selection) , 即 随机 选择 一 个 低 成 本 的 划分 P 作为 下 一 代 的 解 ,也 就 是 将 这 
一 代 中 的 较 强 者 保存 在 下 一 代 中 。 第 二 种 方法 是 杂交 (crossover) , 即 随机 选择 两 个 较 好 的 划 
分 P, AUP, ,将 某 -一 划分 的 一些 特性 复制 到 另 一 划分 中 ,如 将 Ps 中 的 组 p; 复制 到 P 中 ,也 就 
是 将 这 一 代 中 较 强 者 将 通过 混合 后 保存 在 下 一 代 中 。 第 三 种 方法 是 变异 (mutation) , 即 随机 
选择 一 个 划分 ,并 随机 移动 组 间 的 某 些 对 象 来 进行 修改 。 

算法 6.4.4 详细 描述 了 一 个 遗传 划分 算法 , 它 是 对 [KV93] 中 的 算法 经 过 改变 而 得 。 销 
数 CreateRandomPart(O 〇 ) 返 回 给 定 对 象 集 O 的 一 个 随机 划分 ;图 数 Select(G, num _ sel ) 在 
G 当代 的 基础 上 ,通过 选择 的 方法 产生 num _sel 个 划分 ;函数 Cross(G, num _cross) Œ G 
当代 的 基础 上 ,通过 杂交 的 方法 产生 num _cross 个 划分 ;函数 Mutate(G, num _ mutate) 在 
G 当代 的 基础 上 ,通过 变异 的 方法 产生 num _mutate 个 划分 ; num _sel num _cross 和 num _ 
mutate 都 是 算法 的 输入 ;函数 BestPart(G ) 返 回 G 中 成 本 最 低 的 划分 ;函数 Terminate 在 满 
足 终止 条 件 , 即 算法 结束 的 时 候 返 回 真 值 ,一 种 常用 的 终止 条 件 是 最 优 划 分 存活 了 一 定 代数 而 
没有 被 淘汰 ;变量 P _best 保存 所 遇 到 的 成 本 最 低 的 划分 ;输入 gen _size 指明 了 第 一 代 里 出 现 
的 划分 个 数 。 

算法 6.4.4: 遗传 进化 

/x 产生 第 一 代 , 具 有 gen _size 个 随机 划分 * / 

G =o 

for i 从 1 到 gen _ size loop 

G = GU CreateRandomPart(O) 
end loop 


P_ best = BestPart(G) 


/x* 世代 进化 */ 


Oo 
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while 没有 终止 loop 
G = Select(G, num sel) U Cross(G, num _ cross) 
Mutate(G, num _ mutate) 
if Objfct(BestPart(G)) <Objfct(P _ best) then 
P_ best = BestPart(G) 
end if 


end loop 


/x 返回 最 后 一 代 的 最 优 划 分 * / 

return P _ best 

算法 首先 从 第 一 代 里 随机 生成 gen _ size 个 划分 ,然后 通过 选择 、 杂 交 和 变异 来 生成 新 一 
代 , 并 重复 此 步骤 ,直到 满足 终止 条 件 为 止 。 最 后 算法 返回 计算 过 程 中 所 遇 到 的 最 优 划分 。 

遗传 算法 的 复杂 度 和 函数 Terminate 的 形式 有 很 大 关系 。 和 模拟 退火 类 似 ,遗传 算法 通 
常 也 能 得 到 较 好 的 结果 ,但 需要 较 长 的 计算 时 间 。 另 外 ,由 于 遗传 算法 需要 保存 多 个 划分 结 
果 , 因 此 需要 较 多 的 内 存 。 


6.4.8 整数 线性 规划 

划分 问题 也 可 以 通过 线性 规划 进行 求解 。 一 个 线性 规划 有 一 系列 变量 ,一 系列 线性 不 等 
式 作为 变量 值 的 约束 ,以 及 一 个 含有 这 些 变量 的 简单 线性 方程 作为 目标 函数 。 线 性 规划 的 目 
标 是 寻找 满足 所 有 约束 的 变量 ,使 目标 函数 最 小 化 。 

线性 规划 可 以 如 下 进行 描述 。 求 变量 vi vs ww 的 非 负 值 ,使 目标 函数 > .Au 最 
小 ,其 中 k; 均 为 常数 。 变量 满足 m 个 形 如 2 a < b; 的 不 等 式 , 其 中 aj Mlb; 都 是 常数 ， 
且 1< 委 。 其 中 目标 函数 和 约束 不 等 式 的 左 端 都 是 变量 的 简单 线性 函数 , 函数 中 的 变量 都 
和 一 个 常数 相 乘 。 

对 于 划分 问题 的 线性 规划 形式 ,使 用 变量 来 表示 划分 或 度量 的 评估 值 。 例 如 划分 中 将 对 
象 o; 映射 到 组 p; 上 ,就 可 以 引入 一 个 整数 变量 map; = ; ,这 样 每 个 对 象 都 对 应 一 个 map AR 
量 ,这 些 变量 共同 表示 了 整个 划分 结果 。 此 外 还 可 以 定义 变量 areai ,用 来 表示 组 p; 的 面积 评 
估 值 。 使 用 线性 不 等 式 来 表示 约束 ,如 组 p 的 最 大 面积 为 4, 对 应 的 约束 不 等 却 为 areuj < 
A. 目标 函 数 可 以 用 6.3.5 节 中 的 形式 ,但 目标 是 满足 所 有 约束 。 

如 果 在 线性 规划 中 的 变量 只 能 取 整 数值 ,那么 就 叫做 整数 线性 规划 , 即 ILP(integer linear 
program)。 划 分 问题 可 以 转化 为 一 个 ILP, 通 过 不 同 的 方式 来 求解 ,如 分 支 定 界 、 拉 格 明 日 松 
弛 法 等 。 这 些 内 容 已 超出 了 本 书 的 范围 ,这 里 不 再 袭 述 。 由 于 ILP 问题 是 NP-hard 问题 
[GJ79], 通 常 采 用 启发 式 算 法 进行 求解 。 与 模拟 退火 类 似 ,线性 规划 可 以 有 不 同 的 复杂 度 
[Len90]。 尽 管 通过 ILP 的 形式 可 以 获得 划分 的 较 好 结果 ,但 和 上 文 提 到 的 构造 性 和 和 迭代 划 
分 算法 相 比 ,求解 ILP 需要 较 多 计算 时 间 。 


6.5 硬件 功能 划分 


接 下 来 ,我 们 将 对 一 些 已 发 布 的 硬件 组 件 的 系统 功能 划分 算法 进行 简短 描述 ,包括 其 研究 
动机 ,以 及 6.3 节 中 提 到 的 相关 问题 。 
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6.5.1 Yorktown 硅 编 译 器 

1. 研究 动机 

Yorktown 硅 编译 器 也 称 为 YSCECvE87，CB87] , 它 从 一 个 功能 描述 产生 其 逻辑 级 表达 
式 ,然后 使 用 逻辑 综合 来 优化 该 表达 式 ,再 根据 工艺 将 逻辑 运算 映射 到 门 上 。 操 作 的 数量 通常 
很 大 ,因此 需要 很 长 的 运算 时 间 和 大 存储 空间 。 为 了 缓解 这 个 问题 ,可 以 将 逻辑 算 符 进 行 划 
分 ,然后 分 别 对 每 组 划分 结果 进行 逻辑 综合 。 

2. 概述 

如 图 6-6a 中 例子 所 示 ,YSC 接收 功能 描述 ,然后 将 其 转换 为 一 系列 表达 式 , 这 些 表 达 式 包 
含 加 、 减 和 移 位 等 算术 操作 ,以 及 与 或 等 布尔 操作 。 划 分 的 输入 就 是 这 些 表达 式 。 图 6-6b 中 
以 数据 流 图 的 形式 给 出 了 一 个 例子 。 : 

划分 的 对 象 是 给 定 一 系列 表达 式 中 的 操作 ,它们 将 映射 到 模块 上 ,这些 模 块 代 表 着 组 合 逻 
辑 块 ,然后 对 这 些 逻 辑 块 分 别 进行 逻辑 综合 。 模 块 的 数量 由 划分 算法 决定 。 

YSC 使 用 层次 化 结 群 算法 ,并 用 接近 阔 值 作为 终止 条 件 ,如 6.4.2 节 所 示 。 算 法 中 用 到 
的 接近 函数 组 合 了 多 个 度量 ,包括 两 个 操作 之 间 的 互联 线 数 .两 个 操作 与 其 他 操作 间 共 有 的 互 
联 线 数 ,两 个 操作 的 逻辑 共享 性 ,以 及 一 个 操作 群 里 的 晶体 管 数 目 等 。 接 近 函 数 试 者 合并 逻辑 
联系 紧密 的 块 ,并 保持 划分 面积 的 平衡 性 ,该 函数 如 下 所 示 : 

Conn: : kz size Max k3 size _ max 
Closeness( p; » pj) = (Me tp) [ E ~ 际 十 | (6-5) 
其 中 各 表达 式 意义 如 下 所 示 : 





Conn; ; =k, X inputs;,; + wires; ,;, 

inputs; ; 等 于 组 p All p; 共享 的 公共 输入 数量 , 

WITS; j 等 于 组 p; 和 p; 之 间 的 连 线 数量 ， 

MaxConn(P) 等 于 划分 P 中 ,所 有 组 对 p,. py E 的 最 大 连接 数 Conn , 
size; 等 于 组 p; 的 面积 估计 值 ,以 晶体 管 数 来 表示 ， 

size Max 等 于 允许 的 最 大 组 面积 ， 

k1,k2,k3 mE, 


该 式 的 第 一 个 部 分 支持 合并 共享 公共 数据 的 群 , 即 互 联 性 较 高 的 群 。 第 二 部 分 支持 合并 
较 小 的 群 ,这 可 以 使 最 后 的 结果 较 大 ,从 而 得 到 平衡 的 划分 。 第 三 部 分 避免 划分 中 的 群 面积 超 
过 给 定 的 限制 过 大 。 

下 面 来 看 图 6-6 中 的 例子 。 首 先 计 算 b 中 各 个 操作 间 的 接近 值 。 从 图 中 可 以 看 到 ,“ 一 ” 
和 “< ” 间 有 四 位 的 连 线 ,因此 wires- < =4; 而 其 他 操作 间 均 无 连 线 , 因 此 其 余 的 wires 值 均 
为 0。 另 外 ,“+ ”和 “= " 间 的 共同 输入 inputs, =- =4+4=8, 其 余 操 作对 的 共同 输入 均 为 0。 
由 上 可 得 MaxConnectivity(P)=8。 假设 操作 “+”、“=”“ 一 ”和 “< ”分别 需要 120,140,160 
和 180 个 晶体 管 ,那么 可 以 获得 下 面 的 接近 值 ， 


Closeness(+ , =) = ~ 120 ~ GI 40 


Closeness ( 一 <) =x SP x a = 0.8 





=2.9 
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其 他 操作 对 间 的 接近 值 都 为 0。 各 操作 对 间 的 接近 值 如 图 6-6c 所 示 。 
图 6-6d 中 显示 了 层次 化 结 群 的 划分 结果 ,其 接近 阐 值 为 0.5。 操 作 “ + "和 “= "属于 同一 
群 “- ”和 “< "属于 另 一 群 。 


(bit~widths=4) 
a b xX yz 9 © ~ 
SC ~ O g 
PRU Kœ exe 
© <P B2 
N 
b) 操作 c) 操作 接近 值 d) 0.5% BE HS E 





图 6-6 YSC 划分 例子 


如 果 考 虑 到 人 逻辑 优化 ,那么 划分 结果 还 可 以 得 到 进一步 的 改善 。 某 些 操作 能 共享 逻辑 A 
此 更 需要 进行 逻辑 优化 。 这 些 操 作 应 该 具有 较 大 的 接近 值 ,使 其 更 容易 得 到 合并 。 例 如 相等 
和 加 法 操作 可 以 共享 逻辑 ,相等 操作 可 以 通过 按 位 求 异 或 ,然后 将 所 有 输出 的 反 码 求 "与 ?从 而 
得 到 结果 ,而 加 法 操作 可 以 通过 异 或 产生 每 一 位 对 的 和 。 如 果 两 个 操作 具有 相同 的 输入 ,那么 
逻辑 优化 就 可 以 让 这 两 个 操作 共享 异 或 门 , 从 而 减少 需要 的 逻辑 数 。 

为 了 将 这 种 逻辑 优化 可 能 性 结合 到 划分 中 ,需要 定义 一 个 新 的 接近 度量 , 即 相似 度 (simi- 
larity) ,两 个 原子 操作 间 的 相似 度 表 明了 这 对 操作 可 被 逻辑 优化 的 可 能 性 。 在 划分 之 前 ,对 每 
一 对 操作 进行 逻辑 综合 ,来 获得 其 相似 度 。 如 果 综 合 结果 表明 它们 可 以 共享 逻辑 ,那么 这 对 操 
作 就 具有 较 高 的 相似 度 。 在 划分 的 时 候 , 操 作对 间 的 接近 值 与 其 相似 度 相 乘 ,使 相似 的 操作 获 
得 更 高 的 接近 值 ,如 下 所 示 : 

Closeness ( p; , p;) = similarity;,; X Closeness( pi, p;) (6-6) 

图 6-7 中 给 出 了 一 个 使 用 相似 度 划 分 的 例子 。 图 6-7a 为 图 6-6 中 的 例子 ,并 将 国 值 由 
0.5 改 为 3.0, 因 此 各 个 操作 都 不 需要 进行 合并 。 然 而 ,“+ “和 = ”可 以 进行 合并 ,因为 它们 可 
以 在 共享 逻辑 中 获得 很 好 的 逻辑 优化 结果 。 在 引入 了 相似 度 的 理论 后 ,图 6-6b 中 给 出 了 各 个 
操作 间 的 相似 度 值 ,其 中 略 去 了 相似 度 的 计算 过 程 。 在 图 6-6c 中 ,每 个 接近 值 都 乘 以 了 相应 
的 相似 度 , 这 使 得 “+” 和 “= "之 间 的 接近 值 超过 了 立 值 3.0。 在 使 用 了 相似 度 后 ,新 的 结 群 结 
果 如 图 6-6d 中 所 示 , 可 以 看 到 “ +” 和 “= ”位 于 同一 组 内 ,这 和 我 们 期 望 的 结果 相 一 致 。 
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图 6-7 带 相 似 度 的 YSC 划分 


由 于 这 种 划分 技术 中 对 象 的 抽象 级 别 很 低 ,因此 手动 划分 不 太 现 实 。 设 计 者 的 交互 作用 
仅 限于 选择 接近 函数 中 的 常数 值 和 最 大 尺寸 约束 等 。 
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6.5.2 BUD 

1. 研究 动机 

在 物理 设计 中 ,布局 和 布线 每 对 面积 和 时 延 有 着 很 大 的 影 啊 ,BRUDLMK90，McF86] 就 是 
为 了 解决 该 问题 而 提出 的 。 系 统 设计 者 在 做 高 层 决定 的 时 候 , 使 用 到 很 多 “ 自 项 向 下 ”的 信息 ， 
这 些 信息 也 同样 在 综合 工具 中 广泛 使 用 。 因 此 在 高 层次 综合 里 必须 对 面积 和 时 延 做 出 精确 的 
评估 。 

在 高 层次 综合 中 的 每 一 步 ,都 需要 大 量 的 计算 量 才能 做 出 评估 ,这 需要 研究 新 技术 来 减少 
评估 时 间 。BUD 通过 对 CDFG 操作 生成 少量 划分 ,然后 对 每 个 划分 分 别 进行 评 佑 ,从 而 减少 
了 评估 时 间 。 对 一 个 给 定 的 划分 应 用 简单 调度 和 分 配 算法 ,使 该 划分 符合 调度 和 分 配 。 由 调 
度 和 分 配 的 结果 ,就 能 够 对 面积 和 时 延 做 出 估计 。 

2. 概述 

BUD 接受 简单 的 输入 任务 ,将 其 转换 为 CDFG, 然 后 将 CDFG 分 解 为 操作 ,再 进行 划分 。 
操作 将 被 划分 到 数据 通路 模块 上 ,日 模块 数量 预先 不 确定 。 划 分 结果 定义 了 分 配 和 绑 定 ,对 融 
层次 综合 中 的 调度 有 很 大 的 影响 。 

BUD 使 用 层次 化 结 群 算法 来 对 操作 进行 划分 ,并 使 用 两 个 操作 间 的 接近 度量 ,包括 连 线 
数量 、 共 有 连 线 数量 .并 行 执 行 的 可 能 性 ,以 及 功能 单元 的 面积 和 时 延 等 。 使 用 到 的 接近 函数 
如 下 所 示 : 

— FU _cost(o;,0;) 


FU _cost(o;) + FU _cost(o;) 
Closeness (0; ,0;) = aT costloo) O S cost (o.o) 
— 110} 


( Conn (oir0,) | 
Total _ conn (0; ,0;) 


— NX (Par (0;,0;)) (6-7) 
0; 第 i 个 操作 ， 
FU _cost(o;,0;) ”以 时 延 和 面积 为 单位 的 成 本 ,完成 给 定 操作 所 需 功 能 单元 的 最 小 数 ， 
Conn (0; , 0;) o Mo, 共享 的 连 线 数量 ， 
Total _ conn (o; ,0; ) 连接 o; All o; 的 连 线 总 数 ， 
Par (o;o) 如 果 o; Blo; 能 并 行 执行 则 为 1, 否则 为 0。 


该 式 的 第 一 项 支持 合并 那些 部 分 实现 可 以 共享 的 操作 ,这 样 可 以 减 小 硬件 尺寸 。 比 如 加 
法 和 减法 的 实现 相似 ,因为 将 加 法 器 的 一 个 输入 求 反 就 可 以 得 到 减法 器 。 第 二 项 支持 合并 共 
享 数据 的 操作 ,这 可 以 减 小 布线 面积 。 第 三 项 避免 合并 可 以 并 发 执行 的 操作 ,这 可 以 提高 系统 
的 性 能 ,因为 将 这 样 的 两 个 操作 合并 在 一 起 后 就 只 能 顺序 执行 ,必然 会 降低 性 能 。 

为 了 改进 该 式 , 可 以 取 式 中 的 每 项 在 设计 中 的 重要 程度 作为 其 权重 ,如 第 一 项 乘 以 完成 操 
作 o 和 o 所 需 的 功能 单元 的 面积 ,再 除 以 设计 的 总 面积 。 这 样 更 容易 合并 成 较 大 的 模块 。 比 
如 合并 结果 为 1000mm2 的 功能 单元 和 10mm” 的 单元 相 比 ,显然 前 者 对 整个 面积 的 影响 更 大 。 
第 三 项 乘 以 o; Ro 在 从 头 到 尾 的 执行 周期 里 执行 的 可 能 性 ,再 除 以 周期 里 的 平均 步 数 。 这 样 
做 的 结果 是 不 常 使 用 的 操作 更 容易 被 合并 ,并 且 顺 序 执行 ,即使 这 些 操 作 可 以 并 发 执行 。 这 种 
合并 能 减 小 硬件 尺寸 ,并 且 性 能 也 基本 没有 降低 ,因为 不 常 使 用 的 操作 对 整体 性 能 的 影响 很 
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通过 上 述 接近 函数 ,BUD 建立 起 层次 化 结 群 树 ,并 通过 一 个 目标 函数 来 对 结 群 树 上 的 每 
一 级 划分 进行 评估 ,该 目标 函数 是 面积 和 执行 时 间 的 加 权 和 。 

控制 流程 如 下 所 示 :首先 ,计算 各 对 操作 间 的 接近 值 ; 其 次 ,建立 一 个 结 群 树 ,其 中 使 用 接 
近 值 的 平均 值 作 为 新 的 层次 化 对 象 和 其 他 对 象 加 的 接近 值 ; 再 次 ,对 树 中 的 每 一 个 切割 所 得 的 
划分 ,评估 其 面积 和 时 间 ; 最 后 ,选择 成 本 最 低 的 划分 ,通过 高 层次 综合 产生 其 输出 结构 。 

3. 举例 

图 6-8 中 通过 一 个 例子 来 说 明 BUD 划分 技术 。BUD 将 图 6-8a 中 的 输入 行为 转化 为 
图 6-8b 中 的 CDFG( 实 际 上 CDFG 是 另 一 种 不 同 的 形式 ,但 不 同 之 处 这 里 没有 影响 )。 执 行 过 
程 从 图 中 上 面 的 方 框 开始 , 即 把 a + b WHERE <, WÈ a=b 的 话 cond = ‘1? ,否则 cond = 
Oo WR cond = ‘1’ ,那么 第 二 个 方 框 将 执行 ,否则 结束 。 第 二 个 方 框 将 x y<z 的 比较 结 
果 送 入 C 中。 


开始 | (bit-widths=4) 





x:=atb; 
if(a=b) 





c:=((x-v)<z): 











结束 
a) 输入 b) CDFG c) 操作 接近 值 
图 6-8 BUD 例子 | 
图 6-8c 中 给 出 了 各 个 操作 对 之 间 的 接近 值 , 计 算 过 程 如 下 。 首 先 假设 已 知 FU _cost K 


如 下 所 示 : 
操作 功能 单元 成 本 
加 法 器 | 20 














| | 十 
































25 
a 30 
< 20 

= 10 
<=> 25 

其 他 组 合 po - 成 本 和 


因此 ,加 法 操作 所 需 的 功能 单元 成 本 为 20 ,而 减法 为 25。 而 将 加 法 和 减法 合并 到 一 个 结 
群 后 ,成 本 仅 为 30, 这 比 两 个 操作 各 自 的 成 本 和 人 少 ,这 是 因为 加 减法 可 以 共享 硬件 。 小 于 操 
作 .等 于 比较 操作 以 及 小 于 /等 于 /大 于 比较 操作 的 成 本 也 均 列 于 表 中 。 其 他 操作 组 合 后 的 成 
本 均 由 组 合 的 各 操作 成 本 求 和 而 得 。 

根据 FU _cost 表 , 并 假定 所 有 数据 都 是 4 位 ,就 可 以 计算 出 加 法 和 其 他 操作 之 间 的 接近 
值 : 
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其 余 操 作对 间 的 接近 值 的 计算 过 程 都 与 上 述 计算 类 似 。 

图 6-9a 给 出 了 一 个 用 6.4.2 节 中 描述 方法 生成 的 结 群 树 。 对 这 个 结 群 树 可 以 通过 四 种 
不 同 的 切割 方法 得 到 四 种 不 同 的 划分 ,对 每 个 划分 的 面积 和 时 间 评 估 结 果 如 图 6-9b 所 示 。 这 
些 评估 值 由 BUD 中 的 一 个 目标 函数 Obj fet = Area X Time 计算 而 得 。 由 图 中 可 以 看 出 ,成 本 
最 低 的 划分 是 第 三 个 ,该 划分 将 作为 高 层次 综合 工具 的 输入 ,并 产生 三 个 数据 通路 模块 和 一 个 
控制 器 ,每 个 模块 对 应 一 个 划分 ,如 图 6-9c 所 示 。 
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b) 切割 线 计 算 c) 输出 


图 6-9 BUD 划分 例子 


在 BUD 中 ,由 于 操作 的 抽象 级 别 低 ,因此 要 进行 手动 划分 比较 困难 。 因 此 设计 者 的 交互 
仅 限 于 选择 目标 函数 和 接近 函数 中 的 常数 ,以 及 指定 面积 和 执行 时 间 约 束 等 。 


6.5.3 Aparty 

BUD 技术 存在 两 个 明显 的 局 限 ,其 一 是 建立 结 群 树 的 时 候 ,新 对 象 的 接近 值 是 用 结 群 里 
所 有 成 员 的 接近 值 求 平均 而 得 ,而 不 是 经 过 精确 的 重新 计算 而 得 ,因此 两 个 群 的 接近 值 可 能 会 
有 错误 ;其 二 是 互联 功能 单元 共享 性 ,以 及 并 行 操作 可 能 性 这 些 接 近 度量 都 在 接近 函数 里 出 
现 , 因 此 很 难 或 者 不 可 能 在 这 些 部 分 的 权重 间 取 得 平衡 ,来 满足 设计 的 要 求 。 其 他 度量 也 可 能 
存在 类 似 的 问题 。 为 了 克服 这 两 个 局 限 ,研究 者 提出 了 Apartyl LT91,LT89]. 

第 一 个 局 限 可 以 通过 多 级 结 群 来 消除 。 这 种 结 群 需要 定义 不 同 组 操作 间 的 接近 值 ,而 不 
仅仅 是 一 对 操作 。 通 过 引入 另 一 个 不 同 的 接近 函数 ,其 中 每 部 分 都 集中 于 特定 的 度量 ,可 以 消 
除 第 二 个 局 限 。 由 于 结 群 是 分 段 进 行 的 ,每 个 阶段 能 使 用 这 些 函 数 中 的 任 一 个 。 另 外 ,每 个 阶 
段 可 以 使 用 不 同 的 目标 函数 来 对 划分 进行 评估 。 
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概述 

和 BUD 一 样 ,Aparty 的 输入 是 简单 任务 ,然后 被 转换 为 算法 级 数据 流 图 。 再 将 图 中 的 操 
作 划 分 为 一 系列 的 模块 ,其 中 每 个 模块 代表 一 个 数据 通路 模块 或 是 定制 处 理 器 ( 即 控制 器 和 数 
据 通路 )。 这 些 模块 中 的 每 一 个 都 代表 一 个 芯片 或 者 一 部 分 上 芯片。 模块 的 数量 由 划分 算法 决 
定 。 划 分 的 输出 定义 了 调度 .分配 和 绑 定 ,可 以 作为 高 层次 综合 的 输入 。 

划分 中 采用 了 多 级 结 群 算 法 。 接 近 范 数 中 考虑 到 的 度量 有 下 面 三 个 目标 。 第 一 是 减少 控 
制 传输 (control transfer reduction) ,就 是 结 群 之 间 传 递 控制 信息 的 次 数 。 假 定 划分 能 产生 多 个 
控制 器 ,那么 对 于 结 群 之 间 通 信 慢 的 情况 ,就 可 以 通过 这 样 的 措施 来 提高 性 能 。 第 二 是 减少 数 
据 传 输 (data transfer reduction) , 即 减 少 结 群 之 间 用 于 传输 数据 的 连 线 , 这 也 可 以 间接 地 提高 
性 能 。 第 三 是 共享 硬件 (hardware sharing) , 即 通过 共享 功能 单元 来 减少 整个 硬件 大 小 。 组 合 
这 三 种 类 型 的 度量 可 以 得 到 五 个 接近 函数 ,下 面 将 分 别 对 其 进行 说 明 。 

操作 的 控制 接近 性 (control closeness of operation) :这 个 函数 的 目的 是 减少 控制 传输 。 接 
近 函 数 如 下 所 示 : 

Closeness (o; , 0; ) = Prob(o, | 0; ) (6-8) 

st Prob (0; | o) 表 示 在 操作 i 执行 的 前 提 下 ,操作 j 执行 的 可 能 性 ,其 中 两 个 操作 同属 于 一 
个 无 环 CDFG 内 。 比 如 图 6-8 中 ,有 Prob(o.,0-) =1, FF DRUG Prob(o.,0-) = 
0.8。 这 个 函数 的 提出 使 得 那些 在 一 个 无 环行 为 内 ,能够 在 一 步 里 共同 执行 的 操作 更 容易 得 到 


合并 。 
结 群 的 数据 接近 性 (data closeness of clusters) :这 个 函数 的 目的 是 减少 数据 传输 。 接 近 郴 
数 如 下 所 示 : 


Conn ( pi, p;) 


~ Total _ conn (pi) + Total _conn(p;) (6-9) 


Closeness ( p; , p; ) 


” 式 中 Conn M Total _conn 的 定义 同 6.5.2 节 ,并 从 一 对 操作 扩展 到 不 同 组 之 间 。 这 个 函数 处 


理 的 是 不 同 的 结 群 而 不 是 操作 ,因此 函数 的 形式 是 Closeness (p; , 方 ) 而 不 是 Closeness (0; , 0; ) o 
再 以 图 6-8 为 例 , 这 个 函数 支持 合并 不 同 的 结 群 ,否则 在 不 同 结 群 之 间 就 需要 许多 数据 线 来 传 


输 数 据 。 
结 群 的 控制 接近 性 (Control closeness of clusters) :这 个 函数 的 目的 是 减少 控制 传输 。 接 近 
KAn FETZ: 


Closeness ( p; , p; ) = Prob ( p: N p;) = Prob( pi) X Prob( p; | p;) (6-10) 
式 中 Prob ( p ) 是 结 群 p; 中 的 操作 被 激活 的 可 能 性 ,其 中 每 个 操作 都 属于 CDFG 的 任 一 个 无 
环 中 。 这 个 函数 倾向 于 合并 可 能 在 顺序 行为 中 的 同一 步 里 执行 的 结 群 ,而 不 是 操作 。 注 意 以 
下 几 点 :(1) 这 个 函数 考虑 的 是 结 群 对 而 不 仅仅 是 操作 对 。(2) 如 果 无 环 CDFG 中 含有 循环 ， 
附加 的 Prob (p;) 因 子 就 会 提高 共同 执行 操作 间 的 接近 值 ,使 其 高 于 很 少 执 行 操作 间 的 接近 
值 。 共 同 执行 的 操作 对 性 能 的 影响 较 大 ,因此 希望 它们 能 得 到 合并 ,从 而 提高 性 能 。(3) Prob 
(pi; 门 p;) 和 Prob(p;) X Prob(pi|p;) 相 等 。 这 两 个 值 可 能 并 不 相等 ,因为 过 程 间 的 调用 并 不 
一 样 。Aparty 使 用 这 两 个 值 之 间 的 大 者 。 
结 群 的 参数 数据 接近 性 (parameter data closeness of clusters) :这 个 孙 数 的 目 的 是 减少 数据 
传输 。 接 近 函 数 如 下 所 示 : 
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CommCalls( p;, p; ) 





Closeness ( p; , pj) = 


IP CommCalls( p;, pÆ p: 和 p; 共同 调用 的 过 程 的 数量 ; p 是 一 个 过 程 , ExternCalls( p, 
pete p: 中 调用 过 程 py 的 总 次 数 , 如 果 没 有 调用 则 为 0。 这 个 函数 倾 问 于 合并 那些 需要 很 多 
数据 线 来 传递 参数 的 结 群 。 沉 要 注意 的 是 ,在 一 个 公共 陋 数 被 其 他 结 群 调用 的 时 候 , 式 中 的 分 
母 会 减 小 接近 性 。 相 反 如 果 某 个 过 程 仅 仅 被 两 个 结 群 调用 ,那么 这 两 个 结 群 之 间 的 接近 性 会 
得 到 提高 。 

操作 的 功能 单元 共享 性 (functional unit sharability of operations) : 这 个 函数 的 目的 是 提高 
硬件 共享 。 接 近 晴 数 如 下 所 示 : 
> acp Y (O% » 01) size pi) + 2 ,ep ¥ (0% + 01) size pj) 


size( pi) + size(p;) (6-12) 


Closeness ( p; , pj) = 


其 中 各 项 意义 如 下 所 示 : 

Y (oy 5 0;) V opt (O%»01) A gop, 01), 

f (ox, 07) 如 果 os Alo, 被 调度 在 一 个 控制 步 内 则 为 1 ,否则 为 0， 
glo, 01) 如 果 o, Mo 能 共享 一 个 功能 单元 则 为 1 ,否则 为 0。 


这 个 函数 倾向 于 合并 能 够 共享 相同 功能 单元 的 操作 ,而 避免 合并 调度 来 并 行 操作 ,否则 这 些 操 
作 将 被 重新 调度 来 在 一 个 功能 单元 上 串 行 执行 ,这 显然 会 影响 性 能 。 注 意 : 这 里 的 CDFG 必 
须 预先 经 过 调度 。 

”这 些 目 标 函 数 都 可 以 用 来 选择 最 好 的 切割 线 。 在 Aparty 中 描述 了 三 类 目标 函数 ,但 实际 
使 用 哪 一 个 需要 由 设计 者 来 指定 。 第 一 类 目标 函数 为 最 小 化 面积 。 通 过 每 个 结 群 的 功能 单元 
最 小 数量 ,以 及 对 功能 单元 和 多 路 选择 器 面积 进行 求 和 ,可 以 得 到 面积 的 评估 值 。 第 二 类 为 最 
小 化 结 群 之 间 的 连 线 数量 。 连 线 总 数 通 过 对 每 个 结 群 访问 外 部 数据 的 数量 和 大 小 求 平均 值 而 
得 。 第 三 类 为 最 小 化 调度 长 度 。 

对 于 Aparty 内 置 的 目标 函数 ,如 果 对 面积 或 调度 长 度 评估 存在 有 多 个 有 效 切 割 线 , 则 选 
择 评估 值 最 高 的 一 个 。 这 里 假设 切割 数 越 高 ,就 代表 功能 单元 的 共享 性 越 强 ,因此 能 减 小 总 面 
积 。 

控制 流程 如 下 所 示 : 首先, 选择 一 个 接近 函数 Closeness (o;,o;), 对 于 每 一 对 对 和 象 ,计算 
Closeness (0; , 0; ) o 其 次 ,建立 结 群 树 , 通 过 最 大 值 或 最 小 值 计算 合并 后 新 对 象 的 接近 性 。 Fh 
次 ,选择 目标 函数 ,对 结 群 树 中 的 切割 线 确定 的 划分 进行 计算 。 如 果 超 出 约束 条 件 ,就 对 树 的 
下 一 级 切割 线 。 最 后 选择 成 本 最 低 的 划分 。 如 果 设 计 者 不 结束 算法 , 则 根据 新 的 划分 重复 第 
一 步 。 最 终结 果 将 作为 高 层次 综合 工具 的 输入 。 

设计 者 主要 的 交互 体现 在 选择 接近 函数 和 目标 函数 ,以 及 指定 面积 和 执行 时 间 的 约束 。 


6.5.4 其 他 技术 

对 于 给 定 的 算法 级 数据 流 图 ,[Geb92a] 中 提供 的 技术 能 通过 将 问题 转化 为 ILP 来 实现 高 
层次 综合 中 的 调度 .分配 和 绑 定 等 任务 。 在 [Geb92b] 中 将 这 种 形式 扩展 到 多 芯片 上 ,这 样 图 
中 的 每 一 个 操作 都 能 映射 人 到 指定 芯片 的 功能 单元 上 。 然 后 通过 特定 的 技术 来 有 效 解 决 ILP. 
求解 ILP 内 容 已 超出 了 本 书 的 范围 。 

[KP91] 中 描述 了 一 种 名 为 CHOP 的 技术 ,能 够 用 来 对 数据 流 图 的 划分 进行 评 佑 。 对 给 定 


6-1 
2 ErternCalls (Pis Pe) 十 >) ExternCalls (Pis De) (6-11) 
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划分 中 的 每 一 组 ,这 种 技术 首先 产生 一 系列 寄存 器 传输 级 的 实现 ,并 保证 满足 尺寸 . 引 脚 和 时 
间 等 约束 。 这 一 步 里 的 每 一 组 都 有 数 十 或 上 百 种 可 能 实现 方法 ,因此 整个 系统 的 实现 方案 可 
能 成 千 上 万 。 第 二 步 需要 在 这 些 可 能 的 系统 实现 中 选取 少量 满足 全 局 性 能 和 位 速率 的 方案 。 
因此 该 技术 可 以 应 用 到 划分 工具 中 ,来 实现 对 数据 流 图 划分 的 快速 评 佑 。 


6.6 软 硬 件 划 分 算法 


在 嵌入 式 系统 中 经 常 将 软 硬 件 实现 进行 集成 。 软 件 在 已 有 处 理 器 上 执行 ,可 以 减少 制造 
成 本 ,更 容易 进行 修改 ,和 相同 功能 的 专用 硬件 相 比 能 够 更 快 完成 设计 。 但 人 硬件 能 够 提供 更 好 
的 性 能 。 系 统 设计 者 的 目标 是 使 用 尽 可 能 少 的 专用 硬件 来 完成 整个 系统 ,并 满足 需要 的 性 能 
要 求 。 换 名 话说 ,设计 者 应 该 尽 可 能 使 用 软件 来 完成 所 需 的 功能 。 

软 硬 件 划 分 问题 是 6.4.1 节 中 定义 常规 划分 问题 的 一 种 特例 ,其 中 的 一 个 特点 是 二 路 划 
分 ,包括 硬件 和 软件 两 部 分 。 更 重要 的 是 划分 中 含有 性 能 和 硬件 面积 两 个 关键 度量 ,通过 将 对 
象 移 到 硬件 上 可 以 提高 性 能 ,反之 则 可 以 减 小 面积 。 这 些 特 点 使 软 硬 件 划分 需要 特定 的 算法 。 
在 这 一 节 里 ,我 们 将 讨论 软 硬 件 划分 问题 的 三 种 推荐 算法 。 

6.6.1 贪心 算法 

这 是 一 种 简单 快速 的 算法 ,从 一 个 初始 划分 开始 ,移动 能 够 改善 划分 结果 的 对 象 , 算 法 流 
程 如 下 所 示 。 其 中 的 函数 Move (P, 0; BEA o 从 软件 移动 到 硬件 (或 从 硬件 移动 到 软 
件 ) ,返回 一 个 新 的 划分 Po 

算法 6.6.1: 贪心 移动 


repeat 
P_ ong = P 
for i A 1 F| n loop 
if Objfct(Move(P, 0;) < Objfct(P) then 
P = Move(P, o;) 
end if 
end loop 
until P=P_ orig 
算法 6.6.2 中 为 [GD92] 中 给 出 了 贪心 算法 , 它 和 算法 6.6.1 相似 ,并 进行 了 扩展 ,以 保证 
满足 性 能 约束 。 算 法 中 的 函数 Successors (0; ) 返 回 一 组 对 象 ,它们 都 是 系统 功能 内 部 模型 中 o; 
的 后 继 ; 函数 Satis fiesPer formance ( P ERJA] P 满足 各 项 性 能 约束 的 时 候 返 回 真 值 。 
算法 6.6.2: Vulcan I 算法 


/* 全 硬件 的 初始 划分 / 
P = 10, gi 
repeat 
P_ orig = FP 
for 硬件 中 的 每 一 个 of loop 
AttemptMove(P, 0; ) 
end loop 


until P = P_ orig 
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procedure AttemmptMove(P, 0; ) 

if SatisfiesPerformance( Move(P, 0;)) 
and Objfct(Move(P, 0;))< Objfct(P) then 
P = Move(P, 0;) 
for Successors(o; ) 中 的 每 一 个 o; loop 

AttemptMove(P, o,) 

end loop 

end if 


该 算法 开始 生成 一 个 全 硬件 的 划分 方案 ,只 要 存在 性 能 满足 的 划分 方案 ,这 种 初始 划分 就 
能 满足 性 能 约束 (实际 上 , 某 些 不 考虑 约束 的 行为 初始 分 配 到 软件 上 )。 性 能 满足 的 划分 就 是 
一 个 满足 所 有 性 能 约束 的 划分 。 算 法 中 的 移动 对 象 ,不 仅 要 使 成 本 有 改善 ,而 且 还 要 满足 各 项 
性 能 (实际 上 这 需要 满足 组 间 的 最 大 接口 约束 )。 一 旦 行为 进行 了 移动 ,算法 将 试 着 先 移动 与 
该 对 象 接近 的 对 象 。 
贪心 算法 计算 速度 快 ,但 其 主要 缺点 是 无 法 逃 出 局 部 最 小 点 。 


6.6.2 MUHA 

为 了 克服 贪心 算法 的 局 限 , 研 究 者 提出 了 的 山 算法 ,如 模拟 退火 算法 。 扑 山 算法 能 够 接受 
负 方 向 的 移动 ,因此 可 以 逃 出 多 数 局 部 最 小 点 。 只 需要 建立 一 个 初始 划分 ,然后 应 用 该 算法 即 
可 。 

在 [EHB94] 中 介绍 了 一 种 方法 , 它 使 用 全 软件 划分 方案 为 初始 划分 。 然后 使 用 爬山 划分 
算法 来 提取 对 象 从 软件 移动 到 硬件 ,以 满足 性 能 的 约束 。 这 种 提取 也 可 能 将 对 象 从 硬件 移动 
到 软件 ,从 而 减 小 硬件 的 使 用 。 

下 面 来 考虑 看 山 划 分 算法 中 需要 使 用 的 成 本 函数 ,其 难点 在 于 成 本 函数 必须 考虑 性 能 约 
束 和 最 小 化 硬件 两 方面 因素 ,需要 对 其 在 成 本 函数 中 取得 平衡 。 算 法 6.6.2 中 的 成 本 函数 不 
含有 性 能 约束 项 ,从 而 回避 了 这 个 问题 ;算法 对 不 满足 性 能 的 所 有 划分 都 拒绝 。 显 然 这 种 方法 
很 容易 陷入 局 部 最 小 。 某 些 息 山 算法 在 计算 之 前 固定 硬件 尺寸 ,并 在 成 本 水 数 中 去 掉 该 因素 
来 避免 这 个 问题 。 这 种 方法 的 局 限 在 于 需要 设计 者 手动 尝试 多 种 硬件 尺寸 , 且 每 次 都 需要 进 
行 划 分 ,最 终 才 能 找到 满足 性 能 约束 且 面 积 最 小 人 硬件 尺寸 的 划分 。 

第 三 种 解决 方案 是 在 成 本 函数 中 考虑 这 两 方面 因素 ,一 项 为 所 有 性 能 不 满足 的 和 ,为 一 
为 硬件 尺寸 。 为 保证 找到 的 解 满足 性 能 ,性 能 项 需要 较 大 的 权重 ; 即 最 小 化 硬件 尺寸 应 次 要 考 
E. RARU T Br : 

Objfet (P) = Roper X Si Violation (C;) + kaea X Size(hardware ) (6-13) 

式 中 Violation (C;) = Performance (G;) — V; ,如 果 计 算 结 果 为 负 则 取 0。 另 外 krs o> 

Rarea ;但 Ar 不 能 无 限 大 ， 否则 对 一 个 基本 满足 约束 的 划分 和 一 个 起 日 约束 很 多 的 A 


无 法 对 其 进行 区 分 。 
这 种 算法 也 叫做 性 能 权重 爬山 算法 (performance-weighted hill-climbing, PWHC)。 和 算法 


6.6.2 相 比 , 它 能 够 得 到 更 好 的 结果 。 
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6.6.3 二 分 约束 搜索 算法 

PWHC 在 成 本 函数 中 考虑 了 性 能 和 硬件 尺寸 两 方面 因素 ,这 种 情况 下 通 营 能 获得 比 倾心 
算法 更 好 的 结果 。 第 三 种 算法 可 能 获得 更 小 的 硬件 ,这 种 方法 在 一 定 程 度 上 包括 了 将 满足 性 
能 问题 从 最 小 化 硬件 中 分 离 出 来 。 软 硬件 划分 问题 变 为 确定 最 小 硬件 尺寸 约束 ,而 这 个 问题 
可 能 通过 划分 算法 找到 零 成 本 的 解 。 换 句 话 说 ,必须 在 硬件 尺寸 从 零 到 全 硬件 实现 的 范围 内 ， 
寻找 第 一 个 零 成 本 的 解 。 在 搜索 中 ,第 一 个 零 成 本 的 解 应 该 接近 最 小 硬件 尺寸 解 。 很 显然 ,这 
类 在 序列 中 搜索 某 项 的 问题 能 够 通过 二 分 搜索 来 有 效 求解 。 

下 面 来 讨论 最 小 化 硬件 划分 算法 ,该 算法 基于 可 能 硬件 约束 范围 中 成 本 序列 的 二 分 搜索 ， 
也 叫做 BCS( 二 分 约束 搜索 ) 算 法 。 算 法 中 使 用 变量 low 和 high 来 表示 当前 搜索 步骤 中 , 零 成 
本 约束 所 处 的 范围 ;变量 mid 表示 这 个 范围 的 中 间 值 。 另 一 个 变量 P _ zero 保存 搜索 过 程 
中 ,具有 最 小 硬件 约束 的 零 成 本 划分 。 函 数 PartAlg 代表 迭代 划分 算法 ,如 模拟 退火 算法 。 

算法 6.6.3: 二 分 约束 搜索 (BCS) 软 /硬件 划分 


low = 0, high = AllHwSize 
while low < high loop 
mid = (low t+high + 1) /2 
P’ = PartAlg(P, C, mid, Cost()) 
if Cost(P’, C, mid) = 0 then 
high = mid ~ 1 
P_ zero = P 
else 
low = mid 
end if 
end loop — 


return P _ zero 


该 算法 在 可 能 约束 范围 内 ,使 用 二 分 搜索 策略 ,并 对 每 个 被 搜索 的 约束 都 应 用 划分 算法 和 
成 本 函数 进行 判断 。 算 法 在 标准 二 分 搜索 算法 的 基础 上 做 了 两 点 改动 。 其 一 是 变量 mid 用 
来 表示 划分 中 的 硬件 约束 ,划分 的 结果 用 来 确定 成 本 ,而 标准 算法 中 的 mid 为 数组 元 素 的 序 
号 。 其 二 是 成 本 与 0 进行 比较 ,而 在 标准 算法 中 数组 元 素 与 关键 码 进 行 比较 。 | 

这 个 算法 仅 是 软 硬 件 划分 问题 中 的 一 部 分 ,对 普遍 问题 的 研究 还 处 于 初级 阶段 。 
[TAS93] 和 [KL93] 对 该 问题 进行 了 综述 ,并 讨论 了 诸如 粒度 .评估 和 软 硬 件 协同 模拟 等 问题 。 
[EHB94] 和 [GD93] 介 绍 了 软 硬 件 划分 系统 、 算法 以 及 协同 模拟 技术 。 在 [YEBH93] 中 提 到 了 
一 种 快速 软件 性 能 评估 技术 , 它 能 够 很 快 对 划分 进行 评估 。 


6.7 系统 功能 划分 
至 今 已 公布 了 许多 在 软 硬 件 组 件 间 对 系统 功能 进行 划分 的 技术 ,下 面 将 对 其 进行 简短 的 


概述 。 对 每 种 技术 都 将 介绍 其 研究 动机 ,然后 讨论 在 6.3 节 中 提 到 的 相关 问题 。 


6.7.1 Vulcan 
1. 研究 动机 
Vulcan 由 两 部 分 组 成 。Vulcan I 在 只 有 一 个 ASIC 很 小 的 情况 下 [GD90], 在 多 个 ASIC 
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之 间 进 行 功能 划分 ;而 Vulcan II 在 软 硬 件 之 间 进 行 划 分 ,从 而 可 以 通过 使 用 软件 来 减少 ASIC 
”的 成 本 [GD931]。 

2. Vulcan 1 概述 

Vulcan I 的 输入 是 一 系列 任务 和 一 系列 芯片 。 划 分 的 粒度 可 以 是 任务 本 身 , 也 可 以 是 语 
句 块 或 者 算法 操作 。Vulcan I 将 输入 的 任务 转化 为 层次 化 CDFG。 

Vulcan I 首先 试 着 用 粗 粒 度 进行 划分 。 如 果 找 不 到 满足 约束 的 划分 ,CDFG 的 结 点 将 被 
分 解 为 较 细 的 粒度 ,再 重复 进行 划分 。 

Vulcan I 支持 成 组 移动 和 模拟 退火 算法 。 它 使 用 下 面 的 El tx PH, ECP avecut 是 所 有 p; 
切割 数 的 平均 值 ,TT 是 调度 长 度 , maxschedule 是 允许 的 最 大 调度 长 度 ,& 和 ks 是 常数 : 

Obj fct = kı (avgcut ) + k>( T-maxschedule ) 

不 满足 面积 . 引 脚 或 执行 时 间 约 束 的 划分 都 被 认为 是 无 效 划 分 。 

Vulcan I 输出 CDFG 和 每 个 结 点 映射 到 芯片 的 情况 。CDFG 和 映射 信息 作为 高 层次 综合 
工具 的 输入 ,分别 对 每 个 芯片 的 硬件 进行 综合 。 

控制 流程 如 下 :首先 合并 将 在 相同 硬件 上 执行 的 操作 ,保证 这 些 操作 在 划分 的 时 候 不 被 分 
开 ; 其 次 对 每 个 操作 的 面积 、 每 个 互联 的 线 宽 和 数据 流 图 的 调度 长 度 进行 评估 ;再 次 调用 二 路 
划分 算法 。 如 果 结 果 无 法 满足 面积 约束 , 则 将 最 大 操作 的 子 图 进行 分 解 ,然后 对 该 子 图 进行 划 
分 。 重 复 调用 二 路 划分 算法 来 实现 多 路 划分 ;最 后 ,对 每 个 必 片 的 结构 进行 综合 。 

3. Vulcan II 概述 

Vulcan I 将 输入 的 一 系列 任务 分 解 为 语句 块 ,再 进行 划分 。 它 假定 目标 体系 结构 具有 一 
个 处 理 器 一 个 可 被 分 为 多 个 芯片 的 硬件 组 件 、 一 个 系统 总 线 和 一 个 公共 存储 人 船 , 所 有 的 软 硬 
件 通 信和 都 通过 这 个 存储 右 来 完成 。 

这 种 技术 的 关键 点 在 于 将 操作 分 为 三 类 。 具 有 无 限时 延 的 操作 称 为 不 确定 操作 。 这 种 不 
”确定 性 如 果 由 等 待 外 部 事件 而 引起 ,该 操作 即 为 外 部 不 确定 操作 ;如 果 是 由 内 部 数据 的 依赖 关 
系 引起 的 , 比如 依赖 于 数据 的 循环 条 件 ,那么 该 操作 被 称 为 是 内 部 不 确定 操作 。 所 有 其 他 的 操 
作 时 延 有 限 , 因 此 都 是 确定 操作 。 首 先 假设 内 部 不 确定 操作 不 能 受 性 能 的 约束 ,因此 这 些 操 作 
都 安排 在 软件 上 ;以 及 所 有 外 部 不 确定 操作 必须 安排 在 硬件 上 。 因 此 ,只 需要 对 剩 下 的 确定 性 
操作 进行 划分 。 

Vulcan II 中 使 用 的 目标 函数 包含 有 硬件 尺寸 程序 /数据 储藏 量 、 总 线 带 宽 、 数 据 传输 速 
率 、 同 步 开销 和 特定 操作 间 的 时 间 等 多 种 度量 。 它 使 用 6.6.1 节 中 提 到 的 定制 硬件 /软件 划分 
算法 。 开 始 划 分 中 所 有 确定 性 操作 都 在 硬件 上 ,算法 在 满足 性 能 约束 的 前 提 下 ,将 操作 移动 到 
软件 上 ,从 而 减 小 硬件 成 本 。 结 果 划 分 将 作为 高 层次 综合 和 编译 工具 的 输入 。 


6.7.2 Cosyma 

1. 研究 动机 

[EHB94] 中 提 到 的 Cosyma 技术 对 输入 的 一 组 任务 ,能 够 自动 地 在 简单 的 软 硬 件 体 系 结 
构 上 实现 划分 ,这 和 Vulcan II 相同。 该 技术 基于 软件 实现 ,表现 在 (1) 输 入 的 可 执行 描述 可 以 
包含 指针 之 类 的 结构 ,这 些 只 能 在 软件 上 实现 , (2) 而 且 划 分 算法 在 满足 性 能 约束 的 前 提 下 会 
将 尽 可 能 多 的 功能 划分 到 软件 上 。 

2. 概述 

Cosyma 将 输入 的 任务 分 解 为 语句 块 ,再 进行 划分 。 它 使 用 和 Vulcan II 类 似 的 目标 体系 
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结构 ,其 中 含有 一 个 处 理 需 .一 个 硬件 组 件 .一 个 公共 存储 顺和 一 个 系统 总 线 , 所 有 的 软 便 件 通 
信 都 在 系统 总 线 上 完成 。 

Cosyma 使 用 的 目标 函数 中 结合 了 语句 块 执行 时 间 和 通信 时 间 。Cosyma 使 用 模拟 退火 划 
分 算法 ,而 且 可 以 增加 其 他 算法 。 它 从 全 软件 初始 划分 开始 ,算法 将 对 象 移动 到 硬件 上 ,直到 
满足 性 能 约束 为 止 。 | 

OPTRA EEF ERI SET IE. FERIA RT UE C 编译 
器 和 高 层次 综合 工具 来 分 别 实现 软 硬 件 部 分 ,然后 对 设计 进行 模拟 ,以 及 评估 划分 方案 。 根 据 
划分 结果 ,设计 者 再 重新 进行 划分 。 未 来 的 发 展会 将 评估 结果 直接 合并 到 目标 水 数 中 ,从 而 实 
现 自动 重新 划分 。 


6.7.3 SpecSyn 

1. 研究 动机 

在 6.1 节 中 提 到 了 系统 设计 中 的 两 个 主要 问题 ,分 配 物 理 系统 组 件 和 在 组 件 间 划分 行为 。 
上 面 描述 的 划分 技术 主要 是 针对 对 逻辑 块 、 功 能 单元 , 攻 片 或 处 理 器 间 划 分 功能 进行 讨论 。 
SpecSyn[ GVN94,VG92] 从 三 个 方面 来 对 该 问题 进行 了 扩展 。 第 一 是 包含 了 存储 器 和 总 线 这 
两 种 新 的 系统 组 件 , 这 二 者 在 系统 设计 中 很 重要 ,但 前 面 提 到 的 技术 都 没有 考虑 。 第 二 是 包含 
了 变量 和 通信 通道 两 方面 的 功能 ,它们 和 行为 共同 组 成 了 可 执行 描述 ,但 也 经 常 被 忽略 。 第 三 
是 将 物理 系统 组 件 的 不 同 数量 和 类 型 的 划分 看 做 系统 设计 的 一 部 分 。 

在 SpecSyn 中 有 三 个 很 明显 的 划分 问题 。 第 一 是 将 行为 映射 到 系统 组 件 上 ， 如 定制 或 标 
准 处 理 器 ;第 二 是 将 变量 映射 到 存储 器 上 ;第 三 是 将 通信 映射 到 总 线 上 。 其 他 划分 技术 里 通常 
都 忽略 了 后 两 个 问题 。 

另外 ,在 执行 划分 任务 的 时 候 ,SpecSyn 提供 了 较 好 的 交互 式 功 能 。 这 些 交 互 也 是 系统 设 
计 工 具 的 关键 部 分 。 在 其 他 技术 中 ,由 于 划分 的 对 象 和 设计 者 关系 不 大 ,因此 与 设计 者 的 交互 
很 有 限 。 而 SpecSyn 输出 的 是 易 读 的 、 可 修改 的 精确 的 描述 ,而 不 是 一 个 完整 的 实现 。 这 样 的 
描述 支持 手动 和 自动 组 件 设计 技术 的 共同 执行 。 

2. 概述 

SpecSyn 划分 器 将 输入 的 任务 集 分 解 为 三 种 不 同 的 粒度 。 第 一 种 粒度 就 是 任务 本 身 , 第 
二 种 包含 了 任务 和 子 例 程 ,第 三 种 为 语句 块 。 设 计 者 可 以 对 输入 的 不 同 部 分 选择 不 同 的 粒度 。 
SpecSyn 支持 多 种 系统 组 件 ,包括 芯片 .片上 块 , 现 成 的 处 理 器 存储 器 (用 于 变量 ) 和 总 线 (用 
于 通信 )。 它 支持 的 度量 包括 芯片 面积 、 块 面积 ,任务 在 软 硬 件 上 的 执行 时 间 、 软 件 指令 和 数据 
大 小 、 存 储 器 大 小 、 总 线 宽度 、 位 速率 和 成 本 等 。 目 标 函 数 为 各 种 约束 冲突 的 加 权 和 ,并 且 可 以 
由 设计 者 增加 其 他 成 本 也 数 。 | 

如 上 所 述 ,设计 者 必须 解决 划分 中 的 三 个 问题 。 由 于 解决 这 些 问题 不 存在 最 佳 顺序 ,设计 
者 可 以 以 任何 顺序 来 处 理 ,并 可 以 对 其 重复 求解 。 任 何 基本 划分 算法 都 可 以 解决 每 个 划分 问 
题 ,虽然 每 个 问题 都 需要 不 同 的 接近 度量 和 目标 函数 ,但 算法 控制 策略 都 不 变 。SpecSyn 使 用 
特殊 的 软 硬 件 划分 算法 , 即 PWHC 和 BCSC UL 6.6 节 )。 下 面 将 对 SpecSyn 支持 的 几 种 接近 度 
量 进 行 介绍 。 | 

3. 定制 /标准 处 理 器 行为 

将 行为 合并 后 在 定制 或 标准 处 理 器 上 执行 ,由 此 可 以 引出 四 个 接近 度量 。 互 联 (intercon- 
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nection) 是 行为 间 共 享 的 连 线 数 的 估计 值 。 合 并 互联 很 多 的 行为 可 以 减少 引 脚 数 。 通 信 (com- 


munication) 是 行为 间 数 据 传 输 位 数据 位 数 的 评估 值 , 它 和 用 于 传输 数据 的 连 线 数 相 互 独立 。 
合并 通信 较 多 的 行为 可 以 减少 通信 时 间 , 从 而 得 到 较 好 的 性 能 。 顺 序 执行 (sequential execu- 
tion ) 为 布尔 值 , 当 某 个 行为 为 了 完成 其 正确 功能 而 必须 顺序 执行 的 时 候 取 真 值 。 将 顺序 执行 
的 行为 映射 到 同一 个 控制 器 上 不 会 降低 性 能 ,而 将 可 以 并 发 执行 的 行为 映射 到 同一 个 控制 器 
上 则 会 降低 性 能 。 硬 件 共享 (hardware sharing) 是 行为 间 能 共享 的 硬件 所 占 百 分 比 的 估计。 将 
能 共享 硬件 的 行为 进行 合并 可 以 减 小 整个 硬件 矿 才 。 

4. 变量 映射 到 存储 器 

为 了 描述 对 变量 组 合并 在 存储 器 上 实现 ,有 三 个 接近 度量 。 顺 序 访问 (sequential access) 
是 布尔 值 , 当 变量 只 能 顺序 访问 的 时 候 为 真 。 将 顺序 访问 的 变量 映射 到 同一 存储 器 上 不 会 降 
低 性 能 ,而 将 可 以 并 行 访问 的 变量 映射 到 同一 存储 器 上 则 会 由 于 访问 冲突 而 降低 性 能 。 共 同 
访问 量 (common accessors) 是 访问 所 有 给 定 变 量 的 行为 数 。 将 这 些 变量 进行 合并 可 以 减少 总 
连 线 数 。 宽 度 相似 度 (width similarity) 是 变量 之 间 位 宽 的 相似 度 。 将 位 宽 相 似 的 变量 合并 可 
以 减少 存储 器 位 宽 的 浪费 。 

5. 通道 映射 到 总 线 

为 了 描述 通道 的 组 合并 在 总 线 上 实现 ,有 三 个 接近 度量 。 上 顺序 访问 是 布尔 值 , 当 通 道 只 能 
顺序 访问 的 时 候 为 真 。 将 顺序 访问 的 通道 映射 到 同一 总 线 上 不 会 降低 性 能 ,而 将 可 以 并 行 访 
问 的 通道 映射 到 同一 总 线 上 则 会 由 于 访问 冲突 而 降低 性 能 。 文 献 [FKCD93] 中 对 合并 顺序 访 
” 问 通 道 计 进行 了 讨论 。 共 同 访 问 量 是 访问 给 定 通 道 的 行为 数量 。 将 这 些 通道 进行 合并 可 以 减 
少 总 体 连 线 数 。 宽 度 相似 度 是 通道 之 间 位 宽 的 相似 度 。 将 位 宽 相 似 的 通道 合并 可 以 减少 总 线 
宽度 的 浪费 。 

SpecSyn 划分 器 的 输出 信息 为 一 组 映射 关系 ,可 以 作为 细 化 工具 的 输入 。 细 化 工具 产生 
新 的 描述 ,功能 对 象 在 最 近 介绍 的 系统 组 件 上 进行 划分 。 如 果 需 要 ,工具 还 将 增加 通信 细节 和 
PER AR o 

SpecSyn 的 控制 流程 和 设计 者 的 交互 将 在 第 9 章 里 进行 详细 讨论 ,这 里 仅 对 其 指示 和 反 
馈 做 简单 概括 。 主 要 指示 是 在 系统 组 件 上 对 功能 对 象 进行 手动 划分 。 因 为 多 数 功 能 对 和 象 能 被 
设计 者 所 理解 ,使 这 种 手动 的 交互 成 为 可 能 。 设 计 者 可 以 手动 划分 系统 组 件 。 第 二 种 指 问 是 
设计 者 对 目标 函数 进行 定制 。 最 后 是 设计 者 能 任意 选择 自动 算法 执行 的 顺序 。 给 设计 者 的 主 
要 反馈 信息 是 不 同 设 计 度 量 的 评估 值 ,以 及 这 些 值 和 给 定 约束 之 间 的 比较 结果 。 另 外 ,功能 对 
象 之 间 的 接近 性 信息 也 能 提供 给 设计 者 。 
6.7.4 其 他 技术 

给 定 一 系列 任务 和 一 组 互联 的 处 理 器 ,一 个 普遍 的 问题 是 将 每 个 任务 的 执行 调度 到 指定 
的 处 理 器 上 ,以 满足 性 能 的 约束 。 文 献 [SP91] 中 提出 的 一 种 技术 将 这 个 问题 进行 扩充 ,考虑 
了 处 理 器 的 选择 ,而 不 是 仅 提供 互联 的 处 理 器 作为 输入 。 此 时 输入 为 任务 和 任务 间 的 数据 通 
信 , 其 中 任务 的 内 部 功能 不 需要 指定 。 另 外 ,需要 给 出 各 种 可 选 的 处 理 器 类 型 .成 本 等 参数 ,以 
及 每 个 任务 在 各 类 处 理 器 上 的 执行 时 间 。 处 理 器 分 配 和 任务 调度 问题 可 以 用 一 个 ILP 的 形 
式 来 描述 。 设 计 者 的 交互 包括 了 给 ILP 增加 约束 。 
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6.8 折 中 的 探索 


由 可 执行 描述 进行 功能 划分 ,使 得 对 设计 空间 进行 快速 搜索 成 为 可 能 。 为 了 说 明 这 点 ,来 
看 下 面 这 个 系统 组 件 的 分 配 问 题 。 给 定 一 些 系统 组 件 的 类 型 ,必须 选择 各 类 以 及 许多 的 组 件 
来 使 用 。 这 种 选择 比较 困难 ,因为 要 在 划分 实现 后 才能 得 出 分 配 中 的 质量 度量 值 , 而 划分 实现 
又 需要 花费 很 多 时 间 。 通 过 评估 可 以 比 完全 实现 能 更 快 地 获得 这 些 质 量度 量 。 因 为 对 于 可 执 
行 描 述 方法 的 划分 和 评估 可 以 自动 完成 ,这 些 度量 也 就 能 很 快 获得 。 

下 面 用 一 个 例子 来 说 明 在 权衡 时 如 何 快速 获得 度量 值 。 这 是 医学 中 用 来 实时 测量 膀胱 体 
积 的 例子 。 系 统 外 部 的 监控 设备 输入 声 纳 数 据 ,然后 系统 计算 这 些 数据 ,来 检查 膀胱 壁 及 膀胱 
的 体积 ,这 需要 能 动态 调整 监控 设备 的 位 置 。 

假设 有 三 个 厂家 ,各 自 提 供 一 种 芯片 组 , 即 系统 组 件 的 成 本 和 性 能 等 特性 都 不 相同 。 我 们 必须 
选择 一 种 芯片 组 ,然后 将 功能 分 配 到 芯片 组 上 。 另 外 ,假设 处 理 器 在 三 种 芯片 组 上 都 可 以 使 用 。 

首先 对 每 个 芯片 组 ,都 自动 产生 所 有 可 能 的 分 配方 案 ,并 且 将 成 本 上 界定 位 145 美元 。 对 
于 每 种 分 配方 案 ,都 对 系统 功能 进行 自动 划分 ,并 考虑 性 能 和 封装 大 小 . 引 脚 等 约束 。 如 果 不 
满足 大 小 和 引 脚 约束 ,就 不 能 使 用 该 分 配方 案 。 对 剩 下 的 分 配 再 对 系统 性 能 进行 评 佑 。 对 这 
个 例子 ,整个 自动 化 过 程 在 Sparc 2 上 需要 2.5 小 时 的 时 间 。 

图 6-10 中 给 出 了 计算 结果 ,其 中 每 条 曲线 的 第 一 个 点 对 应 全 软件 设计 , 即 所 有 功能 都 在 
处 理 器 上 完成 。 剩 下 各 点 对 应 其 他 分 配方 案 。 芯 片 组 类 型 各 自 不 同 ,有 的 包含 处 理 器 ,有 的 没 
有 处 理 器 。 假 设 我 们 想 要 成 本 最 低 且 性 能 最 好 的 结果 ,在 图 中 可 以 看 到 芯片 组 1 提供 的 解 (点 
A), 它 对 应 一 个 具有 20 000 门 的 简单 芯片 。 芯 片 组 2 也 提供 了 相近 性 能 的 解 ( 点 B) ,但 成 本 
略 高 , 它 也 使 用 了 20 000 门 的 芯片 。 使 用 芯片 组 3 来 达到 相近 性 能 的 成 本 更 加 贵 ,如 点 C 所 
示 。 如 果 不 需要 性 能 最 佳 ,而 只 要 求 性 能 在 650 微 秒 以 下 即 可 ,那么 芯片 组 1 提供 了 最 便宜 的 
解 ( 点 D) , 它 含 有 一 个 处 理 器 ,以 及 10 000 门 的 芯片 。 
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对 于 选择 分 配方 案 , 有 着 许多 需要 考虑 的 因素 ,包括 成 本 和 系统 性 能 。 一 次 性 工程 成 本 
(NRE) \ 功 耗 \ 封 装 尺 寸 、 开 发 时 间 、 生 产 、 厂 家 的 可 靠 性 和 厂家 的 支持 等 。 对 比 不 同 分 配方 
案 , 在 这 些 因素 之 间 取 得 平衡 是 一 件 复杂 的 工作 ,对 此 折 中 曲线 能 发 挥 很 大 的 作用 。 


6.9 结论 和 发 展 方向 


功能 划分 是 系统 设计 中 的 一 个 关键 部 分 , 它 对 最 终 设计 的 质量 有 着 很 大 的 影响 。 功 能 划 
分 由 可 执行 描述 开始 能 获得 最 好 的 结果 ,因为 这 种 描述 容易 被 机 郁 所 理解 ,可 以 在 划分 中 使 用 
自动 评估 和 划分 工具 。 这 些 工具 允许 对 不 同 设计 进行 快速 搜索 ,从 而 获得 很 好 的 总 体 设计 。 
还 有 一 个 优点 在 于 可 执行 描述 还 可 以 和 工具 中 的 某 些 特定 步骤 相 结 合 ,共同 形成 优秀 的 设计 
文档 ,这 能 够 极 大 地 减少 设计 和 上 再 设 计时 间 。 

未 来 的 研究 有 多 个 主题 。 在 设计 完成 实现 后 ,划分 中 的 评估 可 能 不 够 准确 ,还 可 以 对 设计 进行 
改善 。 如 果 在 实现 中 能 获得 度量 ,来 作为 划分 任务 的 反馈 ,那么 重新 划分 的 时 候 就 能 够 用 到 这 些 更 
为 精确 的 度量 。 换 句 话说 ,实现 中 获得 的 度量 值 越 精 确 , 划 分 算法 就 越 容易 找到 更 好 的 解 。 

对 不 同 划分 算法 进行 比较 分 析 也 有 很 大 作用 。 现 在 已 有 一 些 对 电路 划分 进行 比较 的 算 
法 ,但 其 对 功能 划分 并 不 适用 。 此 外 值得 关注 的 问题 是 ,通过 做 出 多 种 可 能 选择 以 及 对 接近 度 
量 进行 排序 ,所 得 到 划分 结果 的 质量 。 

粒度 对 划分 质量 也 有 影响 ,这 点 不 难 理解 。 如 果 能 在 多 种 级 别 粒 度 上 进行 划分 , 那 有 望 得 
到 较 好 的 结 采 。 

许多 系统 都 表现 得 很 规则 。 这 里 的 规则 指 系统 中 的 许多 行为 都 彼此 一 样 ,仅仅 是 行为 处 
理 的 数据 有 所 不 同 。 这 种 系统 通常 用 多 个 相同 的 芯片 来 设计 ;因此 只 需要 对 一 个 芯片 的 设计 
进行 实现 。 将 来 的 算法 会 将 划分 规则 和 半 规 则 行为 的 技术 结合 起 来 。 

总 之 ,由 于 划分 已 经 比较 成 熟 ,未 来 主要 的 任务 是 对 已 有 的 技术 进行 调整 ,并 将 其 应 用 到 
功能 级 。 


6.10 练习 


1. 对 本 章 中 提 到 的 每 个 算法 ,计算 各 自 的 复杂 度 。 

2. (DK N 个 对 象 划分 成 M 部 分 , 求 划分 的 映射 数量 。(b) 将 100 个 对 象 划 分 成 3 部 分 ,有 多 
少 种 可 能 的 映射 方式 ?(c) 如 果 一 种 划分 算法 检测 N 种 划分 ,那么 它 能 检测 所 有 可 能 划分 
的 多 少 ? 

3. 对 第 4 章 中 的 应 答 机 ,将 其 行为 Answer 划分 为 下 列 粒度 :(1) 任 务 级 ,(2) 语 句 块 ,(3) 语 名， 
并 列举 出 各 种 情况 的 功能 对 象 。 为 简单 起 见 ,忽略 行为 RemoteOperation 。 (a) 每 种 情况 各 
有 和 多少 个 对 象 ?(b) 哪 种 粒度 可 能 进行 手动 划分 ? 

4. 假设 一 个 可 执行 描述 可 以 被 分 解 为 50 个 行为 .250 个 语句 块 、 |(+ op 
1750 个 语句 或 者 2 000 个 控制 /数据 流 图 的 操作 。 如 果 某 个 划分 
算法 检验 n 个 划分 ,对 每 个 划分 需要 5 毫秒 来 进行 评估 ,那么 对 
这 四 种 分 解 粒 度 , 该 算法 分 别 需 要 的 时 间 大 致 为 多 少 ? | 

5. 说 明 层 次 化 结 群 和 多 级 结 群 的 区 别 , 以 及 各 自 的 优 缺 点 。 OD Con, 

6. 对 图 6-11 中 的 例子 ,计算 各 对 对 象 间 的 接近 值 ,使 用 BUD 中 提出 
的 接近 函数 ,其 中 加 法 器 和 减法 器 成 本 均 为 1。 | 图 6-11 数据 流 图 例子 


ho 





ho 
ho 
oO 


ho 


126 £6 


. 对 第 4 章 中 的 应 答 机 模型 ,手动 完成 行为 Answer 的 结构 和 二 路 功能 划分 ,目标 为 基本 尺寸 

相等 的 划分 ,并 使 引 脚 数 最 少 。 在 评估 尺寸 和 引 肢 两 方面 对 各 种 方法 的 最 后 实现 结构 进行 
对 比 。 有 余力 者 可 以 对 整个 系统 再 做 一 遍 。 

. 如 图 6-12 ,说 明成 组 移动 是 如 何 改善 划分 的 。 图 中 每 个 顶点 大 小 均 为 1, 每 条 边 权 重 均 为 
1。 假 设 目标 困 数 为 5 x Size Violations + Edges _crossing ,其 中 划分 的 尺寸 约束 为 4。 以 字 
母 顺 序 来 执行 移动 ,如 果 多 次 移动 的 成 本 相等 则 取 第 一 个 。 注 意 , 在 获得 全 局 最 小 成 本 以 
前 ,可 以 接受 负 方 向 的 移动 。 

9. 对 成 组 移动 进行 扩充 ,使 其 对 图 6-13 中 的 例子 ,能够 优先 选择 E 而 不 是 DD 进行 移动 ,因为 

E 的 后 续 移 动 对 象 C 可 以 减少 一 条 边 的 交叉 。 提 示 ,参见 文献 [Kri84]。 
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图 6-12 划分 例子 图 6-13 划分 例子 


10. 对 一 个 图 划分 成 M 个 部 分 的 划分 问题 , 求 其 LP 形式 ,给 定 的 约束 是 总 体 尺 寸 和 每 个 划 
分 部 分 的 切割 数 。 进 一 步 讨论 如 何 对 这 种 形式 进行 扩充 ,使 其 适用 于 功能 划分 。 
11. 假设 在 CDFG 操作 级 进行 软 硬 件 划分 。CDEFG 的 一 部 分 将 映射 到 软件 上 。(a) 设 计 一 个 
算法 ,来 将 CDFG 转换 为 相同 功能 的 软件 ,如 图 6-8b 中 的 例子 。(b) 使 用 该 算法 ,将 图 
6-8b 中 的 CDFG 转换 为 软件 。 
12. 考虑 图 6-8b 中 的 CDFG。 假 设 操作 + A- 都 映射 到 硬件 ,其 他 部 分 映射 到 软件 。 对 软 硬 
件 部 分 分 别 给 出 VHDL 的 功能 描述 ,注意 要 保证 这 两 个 组 件 接口 的 正确 性 ,以 及 完成 通 
信 的 具体 方式 。 
*13. 将 本 章 中 提 到 的 算法 结合 在 一 起 ,实现 一 个 带 权 图 的 划分 工具 。 
“14. 使 用 上 文中 的 工具 ,选择 一 些 例子 ,对 不 同 算法 进行 比较 分 析 ,比较 其 运行 时 间 和 设计 质 
量 ,其 中 目标 函数 自选 。 

** ]5., 设计 一 种 方法 ,来 将 质量 度量 合并 到 划分 中 ,以 此 来 鼓励 带 评估 的 划分 步 又 和 实现 步骤 
间 的 交互 。 

16, 设计 一 种 方法 ,将 功能 划分 和 高 层次 综合 结合 起 来 。 








第 7 章 设计 质量 评估 


在 上 一 章 中 ,我 们 讲述 了 有 关 将 系统 功能 在 各 组 件 间 进行 划分 ,使 诸如 性 能 和 面积 等 设计 
度量 的 约束 得 以 满足 的 一 些 基 本 问题 和 技术 。 然 而 ,为 确认 这 些 约束 是 否 已 真正 满足 ,我 们 必 
须 能 尽快 地 获得 针对 某 些 度量 的 评 佑 结果。 在 本 章 ,将 讲述 一 些 可 用 于 对 软 / 硬 件 的 质量 度量 
进行 快速 评估 的 一 些 技 术 。 
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在 系统 级 对 设计 质量 进行 评估 具有 本 质 上 的 重要 性 。 有 两 个 原因 :第 一 ,使 设计 者 能 将 任 
何 设计 度量 的 估 值 和 对 该 度量 的 约束 值 进行 比较 ,以 此 对 设计 质量 进行 评估 。 例 如 ,如 果 对 某 
设计 的 估计 面积 大 于 所 允许 的 芯片 面积 , 则 设计 描述 中 的 某 个 或 某 些 数组 变量 就 需要 用 必 片 
外 的 存储 器 实现 ,以 满足 芯片 尺寸 约束 。 第 二 ,使 设计 者 和 凭 便 对 设计 决策 的 快速 反馈 ,对 各 种 
设计 选择 进行 探索 。 通 过 这 种 方式 ,设计 者 能 探索 大 量 的 设计 选择 ,而 不 是 对 每 个 设计 选择 都 
是 先 综合 成 完整 的 实现 ,再 测定 特定 的 设计 质量 度量 。 

我 们 可 以 定义 一 个 设计 模型 (design model) 用 于 对 质量 度量 进行 评估 。 任 何 评估 的 有 将 
性 和 可 用 性 取决 于 该 设计 模型 对 真实 设计 的 表示 精度 。 | 

为 表明 设计 模型 对 评估 的 影响 ,在 图 7-1 中 列 出 了 具有 代表 性 的 几 种 设计 模型 ,这 些 设计 
模型 可 用 于 根据 系统 的 功能 描述 来 评估 系统 的 面积 。 图 中 各 种 类 型 的 设计 模型 体现 出 为 提高 
面积 评估 的 精确 性 而 需要 的 细节 进展 (progression of detail) 。 针 对 图 中 的 每 个 模型 ,我 们 也 列 
出 了 评估 工具 必须 执行 的 其 他 一 些 任务 ,以 达到 比 前 面 模型 更 精确 的 评估 。 


低 低 快 
| 高 高 | 慢 
Mem: 存储 器 FUs: 功能 单元 Reg: 寄存 器 Muxes: 多 路 选择 器 
图 7-1 典型 的 评估 模型 及 其 精确 性 、 保 真性 及 评估 速度 


例如 ,如 果 仅 仅 把 系统 中 存储 器 大 小 作为 一 个 模型 ,如 图 7-1a 所 示 , 就 需要 进行 存储 分 配 
(memory allocation) 以 确定 存储 器 的 类 型 和 大 小 ,乃至 设计 面积 。 如 果 在 模型 中 加 入 功能 单 
元 ,如 图 7-1b 所 示 , 则 除了 存储 器 分 配 之 外 ,还 需要 进行 功能 单元 分 配 (functional unit alloca- 
tion) 以 确定 设计 中 功能 单元 的 类 型 和 数量 。 类 似 地 , 若 在 模型 中 结合 进 寄 存 问 和 锁 存 器 ,如 
图 7-1c 所 示 , 则 需要 进行 变量 的 生存 期 分 析 (lifetime analysis) , 以 确定 在 各 个 时 刻 需 要 存储 的 
变量 数 。 进 一 步 在 模型 中 加 入 多 路 选择 器 ,如 图 7-1d 所 示 , 则 需要 进行 功能 单元 绑 定 (func- 
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tional-unit binding) , 以 确定 存储 单元 到 功能 单元 的 连接 数量 ,并 以 此 确定 多 路 选择 器 的 大 小 。 
最 后 ,如 图 7-le 所 示 , 若 在 设计 模型 中 结合 进 布线 的 面积 ,就 需要 进行 布 图 规划 (floorplan- 
ning) 以 确定 组 件 的 实际 位 置 和 方位 ,并 以 此 确定 它们 之 间 互 联 线 的 大 致 位 置 和 长 度 。 


7.1.1 精确 性 与 速度 

前 面 的 讨论 使 我 们 明白 了 在 设计 模型 选择 中 的 一 个 重要 问题 , 即 在 评估 的 准确 性 与 评估 
计算 速度 之 间 取 得 折 中 。 评 佑 的 准确 性 (aceuracy) 是 一 种 度量 , 它 度 量 的 是 估计 值 与 设计 实现 
后 经 过 测量 所 得 到 的 实际 值 之 间 的 接近 程度 。 设 E(D) 和 M(D) 分 别 表示 评估 值 和 经 过 一 
种 设计 实现 D 后 针对 某 种 质量 度量 的 真实 测量 值 , 则 评估 的 精确 度 A 定义 如 下 : 

A=1- EM) -MODI 
M(D) 

依据 此 定义 ,一 个 理想 评估 的 精确 度 A = 1, 其 他 非 理 想 评估 的 精确 度 小 于 1。 精 确 度 依 
束 于 设计 模型 所 呈现 细节 的 程度 。 例 如 ,图 7-1a 中 的 模型 用 存储 器 面积 的 总 和 来 近似 设计 面 
积 。 基 于 这 种 简单 模型 的 评估 工具 运行 速度 快 并 且 易 于 建立 ,其 原因 是 在 评估 度量 的 计算 中 ， 
仅 需要 考虑 少 部 分 设计 特性 。 然 而 ,简单 模型 精确 度 较 低 ,而 这 种 精确 度 正 是 引导 系统 设计 者 
做 出 正确 设计 选择 所 需要 的 。 

另 一 方面 ,一 个 设计 模型 很 可 能 结合 了 设计 的 若干 方面 。 比 如 ,为 了 进行 详细 的 面积 评 
估 , 除 了 要 考虑 布线 面积 外 ,还 要 确定 存储 器 、 功 能 单元 .寄存 器 以 及 多 路 选择 器 的 数量 和 大 
小 。 这 些 考 虑 还 将 进一步 引起 诸如 功能 单元 分 配 变量 生存 期 分 析 \ 功 能 单元 绑 定 以 及 布 图 规 
划 等 任务 的 执行 ,如 图 7-1le 的 例子 所 示 。 基 于 这 种 详细 设计 模型 的 评估 工具 需要 更 长 的 计算 
时 间 ,但 同时 也 会 得 到 更 精确 的 评估 ,因而 也 有 助 于 做 出 一 个 更 好 的 设计 选择 。 

一 般 来 说 ,采用 简化 的 评估 模型 将 获得 快速 的 评估 工具 ,但 同时 也 导致 更 多 的 评估 错误 和 
较 低 的 精确 度 。 另 一 方面 ,只 要 质量 度量 的 评估 值 能 保证 系统 设计 者 在 任何 两 个 设计 选择 之 
间 做 出 适当 的 折 中 决策 , 则 不 一 定 总 需要 很 高 的 精确 度 。 在 这 种 情况 下 ,我 们 就 需要 选择 一 个 
能 产生 高 保 真 度 估 值 的 评估 模型 。 


7.1.2 评估 的 保 真 度 
一 个 评估 方法 的 保 真 度 (fidelity)[KGRC93] 定 义 为 在 设计 实现 之 间 正 确 地 预测 了 其 对 比 
关系 的 百分率 。 对 于 两 个 不 同 的 设计 实现 ,将 某 设 计 度量 的 评估 值 与 测量 值 相 比 ,如 采 两 者 具 
有 相同 的 对 比 关系 , 则 该 评估 正确 地 比较 了 这 两 种 设计 实现 。 换 句 话 说 ,评估 度量 可 用 来 在 许 
多 可 能 的 设计 实现 中 做 出 最 佳 选择 。 评 估 的 保 真 度 度 越 高 ,就 越 有 可 能 依靠 对 两 种 设计 实现 
的 评估 ,做 出 正确 的 设计 决策 。 
为 了 对 保 真 度 做 出 正式 定义 ,我 们 来 看 一 个 任意 的 功能 描述 。 假 设 D = {Di,D;,…,D,| 
为 该 描述 的 一 组 设计 实现 。 若 对 于 所 有 的 i、j ,有 ISi Sn RiF; , 则 1 定义 如 下 : 
1 若 E(CD)>ECDi) 且 MD)>M(Di) 或 者 
E(D;)<E(D;)B M(D,)< M(D;) RA 
pi; = | E(D;) = E(D,)H M(D,;) = M(D;) (7-2) 


(7-1) 


0 ”其 他 
评估 方法 的 保 真 度 下 则 可 定义 为 正确 预测 的 百分率 ,如 下 式 所 示 : 
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F = 100 x 4 wet ee (7-3) 


图 7-2 显示 出 对 某 质 量度 量 的 评估 保 真 度 计算 ， 这 些 计算 是 基于 A、B、C 三 个 设计 点 。 首 先 
来 看 图 7-2a 所 示 的 由 评估 工具 产生 的 对 于 某 质 量度 量 的 评估 结果 和 从 设计 实现 获得 的 实际 
值 。 对 于 该 度量 ,设计 实现 A 的 评估 值 和 实际 值 都 比 设 计 实 现 B 的 要 高 ,对 于 设计 实现 点 对 


(B,C) 和 (4A,C) 也 有 这 种 评估 值 和 实际 值 的 相对 关系 。 因 此 ,该 评估 工具 的 保 真 度 为 100%。 — 


质量 质量 


度量 | ”评估 什 度量 评估 什 
~r Go a WE 
A B C 设计 点 A B.C 设计 点 


a) 100% b) 33% 
图 7-2 评估 保 真 度 的 两 个 例子 


现在 再 来 看 图 7-2b 中 的 设计 点 对 (A,B), 我 们 会 发 现 当 M(A)< M(B) 时 却 有 
E(A)>E(B)。 对 于 设计 点 对 (B,C) 也 有 这 种 相对 关系 。 在 这 三 个 设计 点 对 中 ,由 公式 7-2 
可 以 计算 出 ,只 有 (A,C) 有 非 零 的 wi;; 值 。 因 此 ,图 7-2b 中 评估 工具 的 保 真 度 仅 为 33%。 

当 从 若干 种 设计 实现 中 进行 选择 时 ,基于 高 保 真 度 的 评估 所 引发 的 设计 质量 预测 ,一般 会 
导致 更 好 的 设计 。 保 真 度 依 赖 于 用 于 评估 设计 参数 的 设计 模型 。 一 般 来 说 ,模型 越 精确 ,评估 
保 真 度 就 越 高 。 | 


7.2 质量 度量 


在 本 节 中 ,我们 将 讲述 常用 于 表征 设计 的 一 些 质量 度量 。 其 中 两 个 最 重要 的 度量 为 硬件 
和 软件 实现 的 成 本 和 人 性能。 虽然 其 他 度量 也 非常 重要 ,但 许多 高 层次 决策 是 完全 基于 这 两 个 
度量 的 。 
7.2.1 硬件 成 本 度量 

硬件 成 本 度量 包括 制造 芯片 的 成 本 .封装 成 本 .测试 成 本 以 及 分 摊 的 工程 与 设计 成 本 。 

制造 成 本 取决 于 设计 实现 的 大 小 。 最 常用 的 尺寸 度量 是 设计 面积 , 它 是 一 个 设计 实现 所 
需要 的 硅 面积 。 对 于 一 个 给 定 的 设计 ,面积 评估 一 般 包括 存储 单元 (寄存 器 和 存储 器 ) 、 功 能 单 


元 (ALU) .互联 单元 (多 路 转换 器 和 总 线 ) ,控制 逻辑 等 所 需要 的 面积 以 及 连接 这 些 组 件 所 需 


要 的 布线 面积 。 

系统 级 的 面积 评估 有 助 于 判定 设计 的 某 个 部 分 是 否 适 于 安置 在 芯片 上 的 一 个 给 定 区 域 ， 
该 区 域 在 制造 过 程 中 预计 会 产生 最 大 的 成 品 率 。 例 如 ,如 果 某 设计 经 评估 预计 有 80 000 pm? 
的 面积 ,那么 它 将 不 能 在 最 多 能 提供 50 000 pm? 面积 的 芯片 上 实现 。 必 须 将 该 设计 划分 ,并 
在 两 个 或 多 个 芯片 上 实现 。 

有 时 ,设计 实现 的 尺寸 不 是 用 设计 面积 来 近似 , 而 是 用 相关 的 度量 ,如 晶体 管 、 门 、 寄 存 从 
级 元 件 等 的 数量 ,PC 板 的 大 小 ,或 者 系统 所 需要 的 机 这 空间 。 例 如 ,对 于 半 定 制 ( 门 阵列 ) 和 可 
编程 (FPGA) 技 术 ,每 个 芯片 上 的 门 的 数量 或 者 组 合 逻 辑 块 的 数量 是 有 限 的。 对 这 些 度 量 的 
评估 将 使 系统 设计 者 能 够 确定 需要 多 少 门 阵 列 或 FPGA 来 实现 设计 。 这 种 斥 二 度量 具有 很 
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高 的 保 真 度 ,因为 每 个 晶体 管 . 门 或 寄存 器 级 元 件 的 大 小 是 已 知 的 ,所 以 系统 面积 就 近似 于 这 


些 元 件 大 小 的 总 和 乘 以 一 个 适当 的 常数 ,该 常数 考虑 的 是 布线 和 输入 /输出 的 因素 。 此 外 ,在 
一 个 设计 周期 中 ,可 利用 的 组 件数 目 要 比 可 利用 的 必 片 面积 更 早 预先 知道 。 

封装 成 本 常 近似 为 设计 中 引 肢 的 数量 。 对 引 脚 的 评估 能 力 是 很 重要 的 :设计 者 总 是 努力 
减少 设计 中 引 脚 的 数量 ,其 原因 是 芯片 上 引 脚 的 数量 不 仅 影 响 封装 成 本 ,而 且 由 于 需要 连接 板 
上 的 芯片 ,从 而 影响 电路 板 面 积 。 


7.2.2 软件 成 本 度量 

虽然 硬件 实现 具有 性 能 高 的 优势 ,但 也 有 部 分 设计 用 软件 实现 ,运行 于 特定 的 微 处 理 器 上 。 软 
件 实现 具有 若干 优点 。 首 先 ,实现 成 本 非常 低 , 因 为 处 理 器 和 微 控 制 占 等 可 编程 器 件 通 常 都 是 大 批 
量 制造 的 。 其 次 ,用 软件 实现 开发 时 间 可 大 幅度 缩短 。 给 定 一 个 可 执行 描述 ,软件 实现 的 主要 步 缀 
是 编译 ,而 硬件 实现 则 需要 完成 若干 个 设计 任务 ,包括 测试 和 制造 。 最 后 ,软件 实现 有 助 于 在 设计 
的 后 期 对 设计 描述 进行 改动 。 而 在 硬件 实现 中 ,这 种 改动 经 常 需要 大 量 的 重新 设计 。 

用 软件 实现 的 设计 描述 被 编译 到 所 选择 处 理 器 的 指令 集 。 程 序 存 储量 与 数据 存储 量 是 与 
软件 实现 相关 的 两 个 成 本 度量 。 程 序 存 储量 (program memory size) 是 用 于 存储 由 设计 描述 编 
译 成 的 指令 的 存储 量 。 数 据 存 储量 (data memory size) 表 示 的 是 存储 所 有 数据 值 (变量 和 数组 ) 
所 需要 的 存储 量 , 这 些 数据 值 由 系统 在 执行 计算 的 过 程 中 产生 并 操作 。 例 如 ,对 于 一 个 计算 一 
组 数据 值 的 标准 差 的 程序 ,有 目 这 些 数据 值 存储 于 一 个 数组 中 , 则 设计 者 会 关心 的 是 :在 特定 的 
微 处 理 器 上 ,需要 多 少 条 指令 ,以 及 需要 多 少 存储 单元 来 保存 该 数组 和 所 有 中 间 值 。 

对 程序 与 数据 大 小 度量 的 评估 是 很 重要 的 , 它 直 接地 影响 了 设计 成 本 ,并 间接 地 决定 了 系统 的 
性 能 。 特 别 是 ,我 们 可 能 需要 确定 一 个 程序 是 否 适合 于 一 个 处 理 器 内 置 的 程序 存储 能 力 。 如 果 不 
适合 , 则 必须 增添 额外 的 程序 存储 芯片 ,从 而 导致 设计 成 本 的 增加 。 另 外 ,我 们 可 能 需要 了 解数 据 
量 大 小 ,因为 它 影响 着 数据 存储 单元 的 需要 量 ,而 这 又 反 过 来 决定 了 数据 存储 的 成 本 。 我 们 可 能 还 
需要 确定 数据 量 是 否 小 到 可 以 存储 于 片上 寄存 器 或 高 速 缓冲 存储 器 ,以 期 望 得 到 更 好 的 性 能 。 


7.2.3 性 能 度量 

性 能 度量 可 分 为 计算 度量 与 通信 度量。 计算 度量 是 对 在 一 个 行为 中 执行 计算 所 需 时 间 的 
度量 。 这 种 度量 可 根据 在 计算 度量 时 所 采用 的 时 间 单 位 类 型 来 分 类 。 一 般 可 采用 三 种 类 型 的 
单位 :时 钟 周期 .控制 步 数 和 执行 时 间 ; 通 信和 度量 则 与 某 行为 与 系统 中 其 他 行为 进行 相互 作用 
所 需 时 间 相 关 。 

1. 时 钟 周期 | 

系统 设计 中 的 一 个 重要 决策 就 是 对 系统 实现 的 时 钟 周期 进行 选择 。 在 进行 任务 综合 之 前 
选择 时 钟 周期 非常 重要 ,因为 该 选择 将 影响 到 执行 时 间 和 实现 系统 所 需 资 源 。 

例如 ,在 图 7-3 中 使 用 三 种 不 同 的 时 钟 周期 (380 ns, 150 ns, 80 ns) 来 实现 同一 个 数据 流 
图 ,图 7-3。 在 图 7-3a 中 ,时 钟 周期 380 ns 可 使 系统 具有 最 快 的 执行 时 间 , 但 需要 使 用 2 个 乘 
法 器 和 4 个 加 法 器 实现 ,其 中 乘法 器 和 加 法 器 分 别 有 150 ns 和 80 ns 的 时 间 时 延 ; 男 一 方面 ,图 
7-3b 中 的 150 ns 时 钟 周 期 仅 需 要 一 个 加 法 器 和 一 个 乘法 器 ,但 它 所 需 的 执行 时 间 为 600 ns。 
以 每 单位 资源 的 执行 时 间 为 计 , 最 有 效 的 设计 实现 是 采用 80 ns 的 时 钟 周 期 ,如 图 7-3c 所 示 。 
其 执行 时 间 与 第 一 种 实现 差距 不 大 ,但 所 需 的 资源 数 与 第 二 种 实现 相同 。 
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时 钟 周 期 : 380 ns 时 钟 周期 : 150 ns 时 钟 周 期 :80 ns 
执行 时 间 : 380 ns 执行 时 间 : 600 ns 执行 时 间 : 400ns 
资源 ，2X,4+ 资源 : 1X, 1+ 资源 ，1X, 1+ 


a) b) c) 


图 7-3 时钟 周 期 对 执行 时 间 和 所 需 资源 的 影响 


时 钟 周期 还 决定 了 可 用 于 实现 设计 的 工艺 。 特 定 的 工艺 库 规定 了 库 中 特定 元 件 的 最 大 工作 频 
率 。 例 如 ,VDP100 库 [VTI88 |] 规定 75 MHz 为 最 大 频率 ,在 该 频率 下 双 稳 态 电 路 的 输入 时 钟 可 被 驱 
动 并 保持 稳定 的 逻辑 电 平 转换 。 时 钟 频率 高 于 最 大 规定 值 , 则 在 设计 实现 中 就 不 能 采用 该 库 。 

2. 控制 步 

2.9.3 节 中 介绍 的 FSMD 体系 结构 中 ,控制 单元 将 系统 中 的 操作 安排 为 一 系列 控制 步 
(control step)。 一 个 控制 步 对 应 于 控制 单元 状态 机 的 一 个 单独 状态 。 在 综合 过 程 中 ,功能 描 
述 中 的 操作 被 分 配给 这 些 控制 步 。 实现 一 个 行为 所 需 的 控制 步 数量 影响 到 实现 中 控制 逻辑 的 
复杂 性 。 如 果 一 个 设计 经 过 调度 确定 为 N 个 控制 步 ,那么 状态 寄存 器 的 位 数 则 为 logsNo A 
外 ,如 果 一 个 行为 的 代码 为 顺序 执行 的 结构 ,那么 该 行为 的 执行 时 间 则 与 控制 步 数 成 正比 。 即 
使 行为 中 含有 分 支 与 迭代 结构 ,控制 步 数 也 影响 执行 时 间 。 比 如 ,如 果 一 个 循环 体 有 很 多 控制 
步 , 那 么 该 循环 体 作 为 整体 就 具有 比较 长 的 执行 时 间 。 

3. 执行 时 间 

设计 中 行为 的 执行 时 间 定 义 为 行为 从 开始 到 结束 所 需 的 平 沟 时间。 执行 时 间 与 执行 该 行 
为 所 需 的 控制 步 数 成 正比 。 

对 执行 时 间 进 行 评估 的 重要 性 体现 在 两 个 方面 。 首 先 , 对 某 些 行为 可 能 已 规定 了 性 能 约 
束 , 如 图 7-4a 中 的 行为 B, 它 具有 10 ms 的 最 大 执行 时 间 约 束 。 这 个 约束 可 能 来 自 于 实时 要 
求 , 比 如 从 旋转 的 磁盘 中 以 固定 的 速率 读 取 数 据 。 设 计 者 必须 能 估计 出 任何 设计 决策 对 受 约 
束 行为 的 执行 时 间 的 影响 ,以 确定 是 否 正在 违反 时 间 约 束 。 例 如 ,设计 者 可 能 想 知道 ,通过 分 
配 两 个 加 法 器 来 实现 行为 B 是 否 会 违反 性 能 约束 。 其 次 ,执行 时 间 约 束 将 会 对 选择 用 于 设计 
实现 的 工艺 或 元 件 库 造 成 影响 。 例 如 ,对 执行 时 间 的 评估 ,将 会 使 设计 者 能 够 在 低 成 本 标准 处 
理 器 及 其 编译 的 软件 和 高 成 本 定制 的 ASIC 实现 之 间 做 出 选择 。 

设计 常常 是 通过 流水 线 (pipeline) 实 现 的 。 流 水 线 的 输入 是 以 恒 速 率 到 达 的 数据 流 样 本 。 
流水 线 针对 这 些 数据 进行 计算 ,并 以 相同 速率 产生 结果 输出 流 。 采 用 流水 线 的 主要 目的 是 提 
高 计算 的 速率 ,提高 设计 中 功能 单元 的 利用 率 。 实 现 第 一 个 目标 的 方法 是 :将 行为 中 的 一 系列 
计算 分 为 几 个 阶段 ,并 在 每 个 阶段 后 将 部 分 结果 锁 存 起 来 ;实现 第 二 个 目标 的 方法 是 :将 具有 
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数 进 行 并 发 操作 ,对 每 对 操作 数 所 进行 的 操作 都 在 同一 流水 线 单元 内 得 到 某 一 阶段 的 部 分 计 
算 结 果 。 这 样 ,时 钟 周期 就 缩短 到 等 同 于 最 长 阶段 的 时 延 。 


最 小 50 ns 
行为 B | 
, IN 
pegin | 最 大 通道 C 
A:=A+l, 10ms 






时 间 
a) 行为 执行 时 间 b) 数据 传输 速率 c) 事件 间 时 序 
图 7-4 系统 级 性 能 度量 


两 个 通常 与 流水 线 设 计 相 关 的 度量 是 ;阶段 时 延 和 执行 时 间 。 

流水 线 的 阶段 时 延 (stage delay) 是 指 任 何 阶 段 执行 其 计算 时 所 需要 的 时 间 。 由 于 流水 线 
中 的 所 有 阶段 都 从 同一 时 刻 开始 处 理 数 据 , 因 此 阶段 时 延 也 代表 了 流水 线 输入 能 接受 两 个 连 
续 数 据 样本 的 最 小 时 间 间 隔 。 流 水 线 的 吞吐 量 (throughput) 度 量 的 是 流水 线 产 生出 结果 的 频 
率 。 换 名 话说 ,如 果 stage _delay 表示 流水 线 中 最 长 阶段 的 时 延 , 那 么 该 流水 线 的 吞吐 量 和 阶 
段 时 延 具有 如 下 关系 : 


1 
through put = stage delay (7-4) 


流水 线 的 执行 时 间 是 指 从 数据 到 达 流 水 线 开 始 到 产生 相应 结果 之 间 的 总 时 间 。 流 水 线 的 
执行 时 间 也 常 称 为 潜伏 期 (latency)[HP90]。 关 流水 线 阶 段 的 数量 用 num _ stages 表示 , 则 流 
水 线 执行 时 间 可 如 下 计算 : 

execution _time = num _ stages X stage _ delay (7-5) 

图 7-5 显示 出 非 流 水 线 设计 与 流水 线 设计 的 区 别 。 行 为 的 数据 流 图 如 图 7-5a 所 示 。 采 用 
2 阶段 乘法 器 和 锁 存 器 (在 图 7-5b 中 用 阴影 矩形 表示 ) 可 以 将 该 数据 流 图 划分 成 为 4 阶段 流水 
线 。 图 中 也 显示 出 流水 线 的 阶段 时 延 和 执行 时 间 。 假 设 每 个 阶段 的 时 延 等 于 一 个 时 钟 周期 ， 
那么 ,对 应 于 一 组 输入 ,在 4 个 时 钟 周期 之 后 ,这 两 种 情况 会 得 到 相同 的 结果 。 但 是 ,对 于 图 
7-$a 所 示 的 具有 四 个 时 钟 周期 阶段 时 延 的 非 流 水 线 设计 ,其 吞吐 量 是 每 4 个 时 钟 周 期 产生 一 
个 结果 。 另 一 方面 ,在 图 7-5b 所 示 的 流水 线 化 设计 中 ,具有 一 个 时 钟 周期 的 阶段 时 延 ,其 吞吐 
量 将 是 每 个 时 钟 周期 产生 一 个 结果 ,也 就 是 说 ,是 非 流 水 线 设 计 的 4 倍 。 


l l> l; 14 l; L l; ly 









i} RE 时 间 
Delay(+) =1 时 钟 周 期 
ò Delay( X) =2 时 钟 局 期 © 


a) 非 流水 线 设计 b) 4 阶段 流水 线 
图 7-5 流水 线 
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4. 通信 度量 

并 发 行为 (或 进程 ) 之 间 的 通信 通常 表示 为 消息 通过 抽象 通道 (channel) 传 送 。 每 个 通道 
在 两 个 行为 之 间 传 输 固定 大 小 的 消息 一 一 信息 由 一 个 称 为 产生 者 (producer) 的 行为 产生 ,由 另 
一 个 称 为 消费 者 (consumer) 的 行为 接收 。 在 其 生存 期 内 ,产生 者 行为 将 发 起 若干 次 通道 数据 
传输 。 数 据 传输 速率 ,或 称 比 特 率 (bitrate) ,用 于 度量 通信 通道 传输 的 快慢 。 例 如 ,在 图 7-4b 
中 ,进程 P 通过 通道 C 接收 从 进程 Q 发 来 的 数据 ,其 最 大 速率 为 10 Mb/s. 

对 于 每 个 通信 通道 ,可 定义 两 种 数据 传输 速率 :平均 速率 与 最 高 速率 。 通 道 C 的 平均 速 
Æ (average rate)avgrate(C) 定 义 为 两 个 进行 通信 的 行为 在 整个 生存 期 中 数据 传输 的 速率 。 平 
均 数 据 传输 速率 可 通过 用 发 送 数 据 的 行为 的 执行 时 间 去 除 通 道 传输 的 总 位 数 而 得 到 。 举 例 说 
BA ,图 7-6 显示 出 8 位 消息 经 由 通道 C 的 传输 。 每 个 消息 占用 100 ns 的 通道 时 间 。 由 于 该 通 
道 在 1000 ns 时 间 内 发 送 56 位 的 数据 ,因此 通道 C 的 平均 速率 计算 如 下 : 


avgrate( C) = 36 bits = §6 Mb/s 





200 400 600 800 1000 时 间 (ns) 
图 7-6 通道 平均 速率 和 最 高 速率 的 计算 


通道 C 的 最 大 速率 (peak rate) peakrate(C) 定 义 为 数据 以 单个 消息 在 通道 上 传送 的 速率 。 
最 大 速率 可 通过 用 消息 传送 所 需 时 间 去 除 该 消息 所 携带 的 位 数 来 得 到 。 对 于 图 7-6 中 的 通道 
C ,每 个 消息 传送 需要 100 ns。 由 于 每 条 消息 的 大 小 是 8 位 , 故 其 最 大 速率 为 


8 bits _ 
ma 80 Mb/s 


在 系统 级 对 数据 传输 速率 进行 评估 具有 本 质 上 的 重要 性 ,原因 有 以 下 方面 :首先 ,由 于 每 
个 通道 都 由 总 线 来 实现 ,而 总 线 包括 一 组 导线 和 控制 导线 内 数据 传输 的 协议 ,因此 通信 通道 的 
数据 传输 速率 将 直接 影响 总 线 宽度 。 因 此 ,要 实现 高 平均 速率 和 最 高 速率 的 通道 就 需要 一 个 
比较 宽 的 总 线 。 

其 次 ,通道 速率 直接 影响 到 经 由 通道 通信 的 两 个 行为 的 执行 时 间 。 比 较 慢 的 数据 传输 率 
会 使 得 消费 者 行为 和 生产 者 行为 在 通道 通信 上 花费 更 长 的 时 间 , 从 而 导致 更 长 的 行为 执行 时 
间 。 

最 后 , 当 行 为 被 划分 到 各 个 芯片 上 ,通道 被 划分 到 总 线 上 时 ,通信 速率 扮演 了 一 个 重要 角 
色 。 经 由 通道 以 高 比特 率 进 行 通信 的 行为 更 有 可 能 被 分 配 到 相同 的 芯片 中 ,使 得 片 外 访问 时 
延 最 小 化 。 而 且 , 具 有 很 高 比特 率 的 通道 不 太 可 能 分 到 同一 个 总 线 中 ,这 样 就 使 得 当 硅 干 个 行 
为 试图 同时 向 同一 个 总 线 传输 数据 时 ,使 性 能 退化 达到 最 小 化 。 

5. 事件 间 时 序 

设计 者 可 能 经 常 需要 为 设计 描述 中 的 一 对 事件 规定 时 序 关 系 。 这 种 时 序 关系 表示 两 个 事 
件 发 生 之 间 的 时 间 间 隔 。 例 如 ,在 图 7-4c 中 ,设计 者 规定 :信号 OUT 的 有 效 时 刻 不 能 早 于 信 
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号 IN 有 效 之 后 50 ns。 事 件 间 时 序 表示 了 事件 之 间 的 约束 ,一 般 用 于 时 序 图 中 。 时 序 图 表示 
系统 各 组 件 间 的 接口 。 两 事件 之 间 指定 的 约束 可 以 直接 转换 为 针对 计算 的 约束 ,而 该 计算 需 
要 在 这 两 个 事件 发 生 之 间 执 行 。 
7.2.4 其 他 度量 

现在 介绍 几 个 也 可 应 用 于 系统 设计 的 质量 度量 。 

1. RHR 

系统 组 件 的 功率 耗 散 是 指 在 CMOS 电路 进行 开关 转换 过 程 中 负载 电容 充 放 电 引 起 的 能 
量 耗 散 。 功 率 耗 散 取决 于 系统 的 时 钟 频率 和 在 每 个 时 钟 周期 中 实际 上 处 于 活跃 ( 即 发 生 值 的 
变化 ) 的 门 数量 。 时 钟 频率 越 高 ,组 件 中 的 活跃 门 数 量 越 多 ,组 件 的 功率 耗 散 就 越 大 。 

对 功率 耗 散 进行 评估 有 几 个 方面 的 益处 。 在 电池 驱动 的 系统 中 ,大 功率 需求 要 求 用 大 电 
池 , 这 样 就 导致 产品 成 本 和 重量 的 明显 提升 。 由 于 过 高 的 功率 耗 散会 造成 组 件 失效 ,所 以 , 设 
计 中 可 能 会 耗 散 大 量 功率 的 部 分 一 般 不 把 它们 分 配 到 一 个 封装 中 ,以 避免 在 后 续 阶 段 出 现 组 
件 失效 。 最 后 , 若 试图 通过 提高 时 钟 频 率 来 提高 设计 性 能 ,就 必须 要 考虑 到 小 的 时 钟 周期 所 导 
致 的 功率 耗 散 增加 。 

2. 可 测 性 设计 

可 测 性 设计 产生 具有 最 小 测试 成 本 的 设计 。 测 试 成 本 实质 上 是 内 置 的 测试 硬件 和 设计 实 
现 后 测试 成 本 两 者 之 间 的 权衡 。 组 件 中 内 置 的 测试 硬件 增强 了 对 设计 中 内 部 状态 的 可 控 性 和 
可 观测 性 ,因而 降低 了 组 件 实 现 后 的 测试 时 间 。 可 控 性 (controllability) 定 义 的 是 为 了 达到 测 
试 目 的 而 将 内 部 逻辑 初始 化 为 特定 的 控制 状态 的 能 力 。 可 观 性 (observability) 指 的 是 从 外 部 
对 设计 的 内 部 状态 进行 观测 的 能 力 。 

可 测 性 影响 许多 系统 级 的 参数 。 有 可 能 需要 增添 额外 的 测试 引 脚 以 提高 可 控 性 和 可 观 
性 ,并 导致 封装 成 本 和 封装 装配 时 间 的 增加 。 此 外 ,由 于 测试 电路 的 增加 和 更 多 的 引 脚 驱动 ， 
额外 引 脚 将 导致 面积 与 功率 耗 散 的 增加 。 而 且 , 由 于 内 置 测 试 硬件 ,电路 复杂 性 增加 ,成 品 率 
将 会 大 幅度 下 降 。 因 此 ,可 测 性 设计 在 降低 测试 开销 的 同时 ,也 增加 了 生产 成 本 。 

3. 设计 时 间 

设计 时 间 定 义 为 从 功能 描述 到 获得 设计 实现 所 需 的 时 间 。 设 计时 间 取 决 于 所 采取 的 设计 
方法 。 例 如 ,给 定 系 统 的 英文 描述 文档 ,自动 化 设计 方法 所 采用 的 抽象 级 别 对 设计 时 间 有 显著 
的 影响 。 用 高 级 语言 表示 系统 ,并 采用 高 层次 综合 .逻辑 综合 及 物理 设计 工具 ,要 比 用 人 工 从 
功能 描述 转换 到 晶体 管 原理 图 ,所 需要 的 时 间 要 少 得 多 。 减 少 设 计时 间 的 方法 还 有 :采用 更 多 
的 可 编程 组 件 和 现货 供应 的 组 件 , 使 用 较 少 的 定制 组 件 ,因为 定制 组 件 需 要 大 量 的 设计 和 测试 
开销 。 

4. 上 市 时 间 

上 市 时 间 也 许 是 推动 系统 设计 的 唯一 最 重要 的 因素 ,尤其 是 因为 任何 设计 的 利润 潜力 都 
与 其 进入 终端 用 户 的 早晚 有 直接 的 正比 例 关 系 。 上 市 时 间 可 定义 为 从 设计 概念 化 到 产品 实际 
交付 到 消费 者 手中 所 经 历 的 总 时 间 。 除 了 设计 时 间 , 它 还 包括 对 市 场 进行 调研 ,对 用 户 需求 进 
行 描述 定义 制造、 测试 .销售 ,以 及 为 了 使 设计 可 用 而 进行 的 支撑 软 硬 件 开发 等 所 需 的 时 间 。 

5. 制造 成 本 

制造 成 本 度量 的 是 与 设计 最 终 实现 相关 的 财政 费用 问题 。 制 造成 本 包括 人 力 、 原 材料 、 制 
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7.3 硬件 评估 


7.3.1 硬件 评估 模型 

在 本 节 中 我 们 将 讨论 对 于 硬件 实现 进行 质量 度量 评估 的 一 般 设 计 模 型 。 

给 定 要 进行 评估 的 设计 描述 ,假定 相应 的 设计 用 FSMD 实现 。 如 在 第 2 章 所 述 , FSMD 
体系 结构 包含 一 个 控制 单元 和 一 个 数据 通路 ,如 图 7-7 所 示 。 





控制 单元 数据 通路 


图 7-7 ”用 于 评估 的 控制 单元 /数据 通路 模型 


数据 通路 包含 寄存 器 寄存 器 文件 、 功 能 单元 及 多 路 选择 器 。 一 个 典型 的 数据 通路 有 一 个 
两 级 的 多 路 选择 器 结构 ,如 图 7-7 所 示 。 在 数据 通路 上 的 典型 操作 是 从 寄存 器 或 寄存 器 文件 
中 读 取 操作 数 ,在 功能 单元 中 计算 结果 ,并 最 终 将 结果 写 人 到 目的 寄存 器 中 。 所 有 存储 器 存 取 
都 是 经 由 寄存 器 通过 读 取 和 存储 操作 实现 , 即 在 数据 通路 使 用 某 数据 之 前 将 其 读 取 到 寄存 器 
中 ,并 在 计算 结果 写 到 存储 器 之 前 将 其 存储 到 寄存 器 中 。 

控制 单元 包括 状态 寄存 器 (state register) ,用 于 驱动 数据 通路 组 件 控 制 线 的 控制 未 辑 (con- 
trol logic) ,以 及 用 于 计算 次 态 ( 将 存储 于 状态 寄存 器 中 ) 的 次 态 远 辑 (next-state logic), KAR 
据 通路 的 状态 线 携带 了 次 态 罗 辑 所 需要 的 比较 操作 的 结果 。 

为 了 弄 清 控 制 逻辑 和 数据 通路 的 时 延 是 如 何 影响 系统 时 钟 周 期 的 ,请 见 图 7-7 中 设计 模 
型 的 各 个 路 径 。 该 设计 中 每 条 路 径 定义 了 一 个 数据 流 , 始 于 某 一 寄存 器 ,终于 另 一 寄存 器 , 且 
必须 在 一 个 时 钟 周期 内 完成 。 路 径 p, 是 关于 读 存储 器 的 , 它 始 于 地 址 寄存 器 AR, 途经 存储 
器 并 终止 于 数据 寄存 器 DR,DR 就 是 从 存储 器 取 来 的 数据 要 写 人 的 寄存 器 。 该 路 径 的 时 延 包 
括 读 地 址 寄存 器 的 时 延 ,访问 存储 器 的 时 间 ,数据 寄存 器 的 建立 时 间 以 及 这 些 组 件 间 的 互联 网 
的 时 延 ; 设 计 中 另 一 个 寄存 器 至 寄存 器 的 路 径 ,首先 从 寄存 器 组 读 人 数据 ,通过 多 路 选择 器 
发 送 至 功能 单元 ,并 将 计算 结果 通过 另 一 个 多 路 选择 器 返回 到 寄存 器 组 ;另外 一 个 路 径 加 , 始 
于 状态 寄存 器 ,途经 控制 逻辑 、 寄 存 器 文件 、 多 路 选择 器 、 功 能 单元 ,最 后 经 过 次 态 远 辑 返 回 至 
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状态 寄存 器 。 

为 了 完成 设计 中 每 条 路 径 上 的 数据 传输 ,时 钟 周 期 clk 必须 大 于 设计 中 最 长 路 径 的 时 延 。 
比如 途经 控制 逻辑 的 路 径 p3 具有 最 大 的 时 延 。 因 此 ,最 小 的 时 钟 周期 必须 等 于 或 大 于 路 径 
p3 上 的 所 有 组 件 和 线 网 的 时 延 总 和 。 这 样 ,如果 暂时 忽略 控制 和 状态 位 寄存 器 (status regis- 
ter) ,我 们 需要 遵守 如 下 条 件 : 

clk > delay(SR) + delay(CL) + delay( RF) + delay( Mux) + delay( FU) + delay( NS) 


+ setup( SR) + > delay(n;) (7-6) 
1<i<6 


其 中 ， 

delay( SR ) 表 示 读 状态 寄存 器 的 时 延 ; 

delay( CL ) 表 示 控 制 逻辑 的 时 延 ; 

delay( RF ) 表 示 读 寄存 器 文件 的 时 延 ; 

delay( Mux ) 表 示 多 路 选择 器 的 时 延 ; 

delay( FU ) 表 示 功 能 单元 的 时 延 ; 

delay( NS ) 表 示 次 态 逻 辑 的 时 延 ; 

setup( SR ) 表 示 状 态 寄 存 器 的 建立 时 间 

delay(n; ) 表 示 与 线 网 n; 相关 的 时 延 。 

很 显然 ,如 上 式 计算 的 时 钟 周期 可 能 过 长 ,从 而 导致 设计 性 能 的 显著 降低 。 时 钟 周 期 可 采 
用 控制 流水 线 (control pipelining) 来 减 小 [GDWL91,RG93], 即 在 数据 通路 和 控制 单元 中 之 间 
的 适当 点 处 插入 寄存 器 。 图 7-7 显示 出 如 何 插入 控制 和 状态 位 寄存 器 以 减少 时 钟 周 期 。 例 
如 ,如 果 在 数据 通路 与 控制 单元 之 间 插 人 了 这 两 个 寄存 器 ,时钟 周期 就 成 为 三 条 路 径 中 的 最 大 
时 延 :一 条 从 状态 寄存 器 到 控制 寄存 器 , 另 一 条 从 控制 寄存 器 途经 数据 通路 到 状态 位 寄存 器 ， 
第 三 条 从 状态 位 寄存 器 到 状态 寄存 兹 。 

在 介绍 了 系统 硬件 实现 的 设计 模型 之 后 ,我 们 将 在 下 面 几 节 中 讲述 质量 度量 的 计算 方法 ， 
包括 系统 时 钟 周期 控制 步 数 .执行 时 间 、 通 信和 速率 、 设 计 面 积 、 以 及 引 脚 等 。 


7.3.2 时钟 周 期 评估 

在 7.2.3 节 中 ,我 们 介绍 过 对 时 钟 周期 的 选择 可 以 影响 执行 时 间 和 设计 所 需 的 资源 数 。 
因此 ,在 执行 系统 设计 之 前 对 时 钟 周 期 进行 评估 至 关 重要 。 | 

在 大 多 数 综合 工具 中 [WC91，PK89a，PKG86，BM89，MK90] ,设计 者 在 综合 之 前 必须 
对 时 钟 周期 做 出 规定 。 或 者 明确 规定 时 钟 周期 ,或 者 将 组 件 的 时 延 表示 成 时 钟 周期 的 倍数 。 
当 进行 的 设计 是 一 个 大 型 系统 的 一 个 组 成 部 分 时 ,可 由 设计 者 规定 时 钟 周 期 。 在 这 种 情况 下 , 
系统 中 一 些 标准 组 件 的 时 钟 周期 已 知 ,并 可 用 于 设计 的 其 余部 分 。 

当 设 计 者 没有 规定 时 钟 周期 时 ,就 需要 进行 评估 。 在 本 节 , 我 们 将 提出 评估 系统 时 钟 周期 
的 方法 。 

1. 最 大 操作 时 延 法 | 

一 些 综合 工具 [PPM86, PP85,JMP88] 将 时 钟 周期 等 同 于 设计 中 最 长 的 操作 时 延 。 假 设 
delay (t;) AASB r; 类 型 操作 的 功能 单元 所 需要 的 时 延 。 那 么 ,用 最 大 操作 时 延 法 进行 评 
AG ,时 钟 周期 cik (MOD ) 计 算 如 下 : 

clk (MOD ) = Max 所 有 :+ (delay(t;)) (7-7) 
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例如 ,考虑 二 阶 微分 方程 的 例子 [PKG86] , 它 包 括 加 法 减法 和 乘法 操作 。 假 设 : 

delay( + )=49 ns, delay(—)=56ns, delay( X )=163 ns 

由 式 7-7, 可 以 将 时 钟 周 期 评估 为 以 上 三 种 功能 单元 中 的 最 大 时 延 , 即 clk (MOD) = 
163 nso 

最 大 操作 时 延 法 的 优点 是 对 时 钟 周 期 的 评估 速度 非常 快 而 且 易 于 实现 。 然 而 ,采用 最 大 
操作 时 延 作 为 时 钟 将 导致 对 较 快 功能 单元 的 利用 不 足 。 其 原因 是 , 当 存 在 较 慢 功能 单元 ,比如 
具有 大 时 延 乘 法 器 的 情况 下 ,时 钟 周 期 会 至 少 等 于 乘法 器 的 时 延 ,而 实现 其 他 操作 的 较 快 的 功 
能 单元 将 在 时 钟 周 期 的 很 大 部 分 时 间 内 处 于 空闲 状态 。 因 此 ,采用 最 大 操作 时 延 法 ,就 布 望 设 
计 具 有 较 长 的 执行 时 间 。 

2. 时 钟 松 弛 

为 了 改进 设计 的 性 能 ,我 们 需要 使 功能 单元 的 空闲 时 间 最 小 化 。 功 能 单元 的 时 钟 松 弛 
(clock slack) 就 表示 该 功能 单元 在 一 个 时 钟 周期 内 空闲 的 那 部 分 时 间 。 松 弛 (slack) 定 义 为 功 
能 单元 的 时 延 与 下 一 个 更 高 倍 的 时 钟 周期 的 差 。 与 前 面 一 样 ,我 们 定义 delay(z;) 为 实现 t; 类 
型 操作 的 功能 单元 所 需要 的 时 延 。 对 于 一 个 给 定 的 时 钟 周 期 cR 和 操作 类 型 i; ,相应 的 功能 
单元 的 松弛 slack (clk ,z;) 由 下 式 进行 计算 : 

slack (clk ,t;) = (|[ delay(t;) + clk |X clk) — delay(t;) (7-8) 

我 们 一 般 都 假定 ,对 应 于 某 功 能 单元 ,比较 小 的 松弛 将 会 导致 对 该 功能 单元 更 充分 地 使 
用 ,以 及 在 相同 数量 资源 的 情况 下 达到 更 短 的 执行 时 间 。 

图 7-8 描绘 了 针对 微分 方程 例子 的 不 同 操作 所 对 应 的 松弛 。 假 设 用 最 大 操作 时 延 法 来 确 
定时 钟 周期 。 由 于 乘法 器 有 最 大 时 延 , 故 时 钟 周期 clk (MOD) = 163 ns. RAA 7-8, 我 们 可 
以 算出 以 下 松弛 : 

slack (163, X ) = ([ 163+ 163] x 163) — 163=0 ns 
slack (163, — ) = ({ 56+ 163 | x 163) —56=107 ns 
slack (163, + ) = ([49 +163 | x 163) —49=114 ns 

图 7-8 中 浅 阴 影 区 域 表 示 用 于 实现 设计 的 加 法 器 \ 减 法 器 和 乘法 器 的 时 延 。 对 于 163 ns 
的 时 钟 周 期 ,加 法 器 和 减法 器 都 有 比较 大 的 松弛 ,如 图 中 的 黑色 区 域 。 若 时 钟 周期 比较 长 ,并 
且 在 时 钟 周期 的 很 大 一 部 分 时 间 内 某 些 功能 单元 是 空闲 的 , 则 必定 会 导致 较 长 的 运行 时 间 , 正 
如 在 该 设计 中 采用 163 ns 时 钟 的 情况 。 


描述 中 
的 操作 时 钟 周期 





50 100 150 | 时 间 (ns) 


ci clk(MOD) 
人 


图 7-8 163 ns 时 钟 周 期 下 的 功能 单元 的 松弛 
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3. 最 小 松弛 法 

最 小 松弛 法 的 思想 是 LNG92]: 在 假定 比较 小 的 松弛 能 够 促进 功能 单元 的 充分 利用 ,并 依 
此 降低 行为 执行 时 间 的 前 提 下 ,使 每 个 时 钟 周期 的 松弛 最 小 化 。 

式 7-8 给 出 了 功能 单元 松弛 的 计算 式 。 对 于 给 定 的 时 钟 周 期 c 归 ,平均 松弛 (average 
slack) ave _slack (clk ) 定 义 为 时 钟 周期 的 一 部 分 ,在 该 部 分 中 的 每 个 单元 在 平均 状况 下 都 处 于 
250A. WRH occur (ti) 表示 行为 中 去 类 型 操作 发 生 的 数量 , T 表示 操作 类 型 的 数量 (如 加 、 


WFR) ,那么 平均 松弛 如 下 式 计 算 ; 


y 
>) (occur (t;) x slack (clk, t;)) 
ave _slack(clk) = > (7-9) 


Y， occur (t; ) 
时 钟 利用 率 (clock utilization) 定 义 为 设计 中 所 有 功能 单元 进行 的 有 用 计算 在 一 个 时 钟 周 
期 内 所 占 的 百分比 ,也 就 是 说 : 


utilization (clk) =1- ave _ slack (clk ) (7-10) 


clk 
最 小 松弛 法 检验 的 是 潜在 的 时 钟 周 期 范围 ,计算 的 是 每 个 时 钟 周期 的 利用 率 。 对 于 某 个 
行为 B, 使 其 时 钟 利 用 率 最 大 的 时 钟 周 期 就 可 作为 最 小 松弛 时 钟 。 


算法 7.3.1: 松 弛 最 小 化 


/x 确定 每 种 操作 类 型 发 生 的 次 数 * / 
ComputeRange( T, clkmax, clkmin) 
for each 1;€ T loop 

occur (t;) = FindOccurrences( B, t;) 


end loop 


/* 计算 每 种 可 能 时 钟 的 利用 率 7 
max _utilization = 0 
for clkmin<clk<clkmax loop 
for each z;© T loop 
slack (clk , t;) = ({ delay(t;) + clk |X clk) — delay(t;) 
end loop 
>) Loccur (2) x slack (clk ,t;) | 
Soe occur ( t;) 
_ ave _ slack (clk) 


utilization (clk) =1 “lb 


ave _Slack(clk) = 


if utilization (clk) > max _ utilization then 
max _ utilization = utilization (clk) 
max _ utilization _clk = clk 

end if 


end loop 
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return( max _ utilization _ clk) 


算法 7.3.1 描述 了 如 何 利用 最 小 松弛 法 进行 时 钟 评估 。 不 同 的 操作 类 型 数 用 OT 表示 。 
过 程 ComputerRange 用 于 确定 时 钟 周期 的 范围 ,这 些 时 钟 周期 将 会 由 算法 来 检验 ,检验 方法 
是 考察 用 于 实现 行为 的 本 类 操作 中 的 每 个 操作 所 需 功 能 单元 的 时 延 。 时 钟 周 期 的 范围 用 
(clkmin ,clkmaz ) 表 示 。 所 有 功能 单元 的 最 大 时 延 用 clkmax 表示 。 设 计 库 通常 规定 了 双 稳 
态 电路 的 最 大 时 钟 输入 频率 ,使 得 能 在 逻辑 级 保持 稳定 的 转换 。 该 频率 用 于 确定 clkmin 的 
值 。 在 没有 规定 最 大 时 钟 频 率 的 情况 下 ,clkmin 近似 为 delay(z; ) 的 最 小 值 。 

PRIA FindOccurrences 对 行为 B 的 行为 描述 进行 检查 ,并 返回 其 中 t 类 型 操作 的 发 生 次 
MX. KMT t; 类 型 操作 的 功能 单元 的 时 延 表示 为 delay(t;)。 






对 于 每 个 处 于 范围 (clkmin ，clkmaz ) 内 的 时 钟 aa | 

$h 作 occur (t;) (t;) 
周期 c 帮 ,最 小 松弛 算法 利用 式 7-8 RYE IL T ti 人 
为 中 某 个 操作 的 功能 单元 的 松弛 进行 计算 。 这 样 ， 
ee eres T 





clk 的 利用 率 可 由 式 7-10 算出 。 由 算法 7.3.1 得 出 
的 最 大 时 钟 利 用 率 保存 在 max _ utilization 中 ,相应 
的 时 钟 周 期 保存 在 max _ utilization _clk 中 。 使 时 
钟 利 用 率 最 大 化 的 时 钟 周 期 值 作为 最 小 松弛 时 钟 返回 。 

我 们 通过 将 该 算法 应 用 到 二 阶 微分 方程 例子 [PKG86] 来 进行 说 明 。 每 个 操作 发 生 的 次 数 
和 用 于 实现 这 些 操作 的 功能 单元 的 时 延 如 图 7-9 所 示 。 其 中 用 到 的 组 件 来 源 于 VDP100 数据 


图 7-9 微分 方程 例子 中 操作 发 生 
次 数 和 操作 时 延 


通路 库 [VTI88]。 
在 图 7-10a 中 ,功能 单元 的 时 延 图 示 为 沿 X 轴 的 浅 阴 影 区 域 长度 。 行 为 操作 出 现 的 次 数 
表示 为 沿 Y 轴 的 阴影 区 域 的 高 度 。 
设计 中 操作 


出 现 的 次 数 EX 及 2X CLK 3XCLK 
4 | 





功能 单元 时 延 a) 松弛 图 松弛 


6 X 32 





T = + Ge = 
6 E2 + 2 
b) 平均 松弛 


图 7-10 计算 时 钟 周期 为 65 ns 的 情况 
由 于 VDP100 库 规定 时 钟 寄存 器 的 最 大 频率 为 75 MHz ,所 以 clkmin = 1/75 MHz= 14 ns. 


ave_slack(65 ns) = 
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最 大 功能 单元 时 延 为 clkmax = delay( X )=163 nso 
我 们 可 以 计算 出 时 钟 周期 为 65 ns 的 时 钟 利 用 率 。 利 用 式 7-8, 我 们 可 以 得 出 : 
slack (65, xX )= (3x65)—163=32ns 
slack (65, — )=(1x65)-56=9 ns 
slack (65, + )=(1 X65) —48 =17 ns 
在 图 7-10a 中 的 黑色 阴影 区 域 表示 的 是 每 种 操作 类 型 的 松弛 。 针 对 65 ns 时 钟 周 期 的 平 
均 松 弛 可 由 式 7-9 算 出 ,并 在 图 7-10b 中 显示 出 来 。 平 均 松 弛 为 24.4 nso 
最 后 ,利用 式 7-10 我 们 可 以 得 出 65 ns 时 钟 周 期 的 时 钟 利用 率 : 


utilization (65 ns)=1— as =0.62=62% 


针对 从 14 ns 到 163 ns 的 所 有 时 钟 周期 值 ,重复 进行 时 钟 利 用 率 计算 。 在 56 ns 时 钟 周 期 
处 ,达到 了 最 大 时 钟 利用 率 92% ,如 图 7-11a 所 示 。 该 值 被 选 做 最 小 松弛 时 钟 clk( SM)。 一 


付 钟 周 期 (ns) 





0.0 20.0 400 600 800 100.0 
利用 率 (%) 


a) 时 钟 周期 与 利用 率 的 关系 


执行 时 间 (ns) 





400400 20.0 40.0 60.0 80.0 100.0 


b) 执行 时 间 与 利用 率 的 关系 


图 7-11 微分 方程 例子 


为 表明 具有 最 大 利用 率 的 时 钟 周期 确实 会 导致 比较 快 的 执行 速度 ,对 于 每 个 从 clkmin 到 
cikmax 范围 内 的 时 钟 周期 ,可 通过 对 行为 描述 进行 调度 并 用 控制 步 数 乘 以 时 钟 周期 的 方法 来 确 
定 实际 执行 时 间 。 图 7-11b 描绘 出 微分 方程 例子 的 执行 时 间 相对 于 时 钟 利用 率 的 变化 。 图 中 显 
示 出 ,最 小 松弛 时 钟 56 ns 会 得 到 560 ns 的 执行 时 间 ,并 具有 92% 的 利用 率 。 只 有 一 个 时 钟 周期 
(15 ns) ,其 利用 率 为 71% ,可 以 导致 一 个 达到 边际 的 快速 设计 ,执行 时 间 可 达 555 nso 
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实验 表明 ,采用 最 小 松弛 法 进行 评估 所 实现 的 设计 ,要 比 用 最 大 操作 时 延 法 所 实现 的 设 
计 , 性 能 上 要 好 32%[NG92j。 不 管 在 设计 实现 过 程 中 资源 如 何 分 配 ,执行 时 间 还 是 减少 了 。 

在 文献 [LGSV92 j] 中 对 最 小 松弛 算法 做 出 了 两 点 修正 。 首 先 ,将 多 周期 操作 中 的 中 间 时 钟 
周期 引入 到 时 钟 利 用 率 计算 中 ,与 式 7-10 计算 出 的 利用 率 相 比 ,该 方法 得 出 了 关于 执行 时 间 
和 时 钟 利用 率 倒 数 之 间 更 好 的 相互 关系 ;其 次 ,不 是 对 从 clkmin Bll clkmax 整个 范围 内 的 时 钟 
周期 进行 检验 ,而 仅仅 对 是 功能 单元 时 延 因 子 的 时 钟 周期 进行 检验 ,因而 大 大 降低 了 算法 的 计 
算 时 间 。 
7.3.3 控制 步 评估 

行为 执行 所 需 的 控制 步 数 可 通过 若干 种 方法 评估 。 在 本 部 分 中 ,我 们 首先 讲述 两 种 技 
术 一 一 运算 符 一 使 用 (operator-use) 方 法 和 调度 算法 ,用 来 评估 定义 成 直线 型 代码 的 行为 的 控 
制 步 数 。 然 后 ,我 们 针对 包含 有 分 支 和 和 迭代 控制 结构 的 行为 提出 一 种 对 控制 步 数 的 评估 方法 。 

1. 运算 符 一 使 用 方法 


运算 符 -使 用 方法 在 给 定 实现 行为 的 所 需 资源 的 情况 下 ,评估 执行 该 行为 的 控制 步 数 。 


该 方法 将 行为 中 的 所 有 语句 划分 成 一 组 结 点 ,使 得 一 个 结 点 内 的 所 有 语句 可 并 发 执行 。 

设 T ERISH B 中 不 同类 型 操作 的 数目 , num (4;) 和 clocks (+4) 分 别 表示 为 实现 1, 类 型 
操作 时 ,可 以 采用 的 功能 单元 的 数目 和 时 延 ( 用 时 钟 周期 数 表示 )。 那 么 ,在 任意 一 个 结 点 中 ， 
如 果 类 型 操作 出 现 (或 使 用 ) occur() 次 , 则 至 少 需 要 | SEMEL x clocks(#) | 个 控制 步 来 
执行 n 类 型 操作 。 任 一 结 点 ny 所 需 的 控制 步 数 csteps (%) 等 于 在 结 点 中 运行 任何 类 型 操作 
所 需 的 最 大 控制 步 数 , 即 : 
| see 


num (t;) 


] clocks (4) | (7-11) 


t :}) = max 
cS eps(n;) net 


一 旦 每 个 结 点 的 控制 步 数 已 定 , 则 行为 B 中 所 需 的 总 控制 步 数 就 可 如 下 确定 : 
csteps(B) = > J esteps (n;) (7-12) 
n.€N 


其 中 NN AB 中 的 结 点 数 。 
算法 7.3.2: 操 作 符 -使 用 方法 


CreateNodes( B, N) 
csteps(B)=0 
for each node n; E N loop 
csteps(n;) =0 
/* 对 于 在 当前 结 点 中 的 所 有 操作 类 型 了 x / 
for each operation type t;€ T loop 
/x 计算 结 点 中 i 操作 类 型 的 控制 步 x*/ 
csteps( nj;,t;) = [e] X clocks( t; ) | 
/* 计算 结 点 中 的 最 大 控制 步 数 x/ 
if csteps (n;,t;)>csteps(n;) then 
esteps(n;) = csteps(n;, ti) 
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end if 
end loop 
csteps( B) = csteps (B) + csteps(n;) 
end loop 


return csteps( B) 


算法 7.3.2 显示 出 操作 符 -使 用 法 如 何 计算 行为 互 的 总 控制 步 数 。 过 程 CreateNodes 将 
行为 B 中 的 语句 划分 成 为 NN 个 结 点 的 集合 。 将 行为 中 的 语句 合并 到 结 点 中 所 采取 的 方式 是 ， 
保持 语句 间 的 依赖 关系 ,并 使 结 点 总 数 最 少 。 如 果 语 句 S, 依赖 于 语句 S1, 则 Ss 所 分 配 到 的 
结 点 应 是 Si 所 分 配 到 的 结 点 的 后 继 。 操 作 符 - 使 用 法 的 这 种 将 语句 聚合 成 结 点 的 过 程 与 时 
钟 周期 和 为 该 设计 配置 的 资源 数量 无 关 。 

对 于 每 个 结 点 ,算法 7.3.2 计算 出 完成 工 个 不 同 操作 类 型 中 的 每 个 操作 所 需 控 制 步 数 。 
变量 csteps (nj, t ERRERA n 中 为 计算 i; 类 型 操作 所 需 的 控制 步 数 。 式 7-11 计算 得 出 的 
变量 csteps (nj ) 表 示 为 执行 结 点 n 中 的 所 有 操作 所 需 的 控制 步 数 。 将 每 个 结 点 所 确定 的 控制 
步 数 相 加 ,如 式 7-12 所 示 ,就 确定 了 整个 行为 的 总 控制 步 数 。 


最 大 结 点 
控制 步 
add:(1/1)"1=1 
mult:(4/2)"4=8 
max(1,8)=8 


_ | u4:=u] Xu2 add:(1/1)*1=1 
u5:=dxXu3 |mult:(2/2)4=4 
y:=ytyl max(1,4)}=4 


sub:(1/1)*1=1 
max(1)=1 















b) pias c) 语句 间 的 依赖 关系 d) 结 点 及 控制 步 评估 


图 7-12 ”应 用 于 微分 方程 例子 的 操作 符 — 使 用 法 


以 微分 方程 为 例 说 明 操作 符 - 使 用 法 。 图 7-12a 示 出 的 是 加 法 器 ,减法 器 和 乘法 器 的 次 
源 配置 和 时 钟 周 期 时 延 的 情况 。 行 为 的 主体 示 于 图 7-12b。 单 个 语句 之 间 的 依赖 关系 在 图 7- 
12c 中 用 箭头 表示 。 在 图 7-12d 中 ,语句 被 合并 成 为 四 个 结 点 n1、n2、ns、ns。 请 注意 在 将 语句 
合并 成 结 点 的 过 程 中 ,没有 违反 原始 行为 中 的 依赖 关系 。 换 句 话说 ,如 果 两 个 状态 互相 依赖 ， 
那么 为 了 保持 这 种 依赖 性 ,它们 将 被 分 配 到 两 个 不 同 的 结 点 。 

图 7-12d 显示 出 采用 式 7-11 对 每 个 结 点 计算 控制 步 数 的 情况 。 例 如 , 结 点 n 包括 一 个 
加 法 操作 和 四 个 乘法 操作 , 即 occur( + )=1 和 occur( x )=4。 由 于 仅 配置 了 两 个 乘法 器 且 每 
次 乘法 需要 四 个 时 钟 周期 , 则 这 四 个 乘法 操作 将 需要 至 少 八 个 控制 步 。 类 似 地 ,该 结 点 中 的 单 
个 加 法 操作 需要 一 个 控制 步 来 执行 。 利 用 式 7-11, 我 们 可 以 估计 出 结 点 n 至 少 需要 八 个 控 
制 步 来 执行 其 操作 。 利 用 式 7-12 将 行为 中 所 有 结 点 所 需 的 控制 步 数 加 起 来 ,就 可 以 估计 出 需 
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要 14 个 控制 步 来 实现 微分 方程 的 行为 。 

操作 符 -使 用 法 还 可 以 扩展 使 之 能 结合 进 流水 线 功 能 单元 和 包含 存储 器 访问 。 例 如 ,请 
考虑 一 个 具有 固定 访问 时 间 的 多 端口 存储 器 。 如 果 我 们 将 存储 器 看 做 一 个 功能 单元 ,那么 结 
点 对 存储 器 的 访问 次 数 就 对 应 于 操作 发 生 的 次 数 , 访 问 存 储 器 的 有 效 端口 数 就 等 于 为 每 个 操 
作 所 分 配 的 功能 单元 数 ,并 且 内 存 访问 时 间 与 功能 单元 的 时 延 相 同 。 因 此 ,现在 就 可 以 直接 利 
HA 7-11 来 确定 结 点 在 有 存储 器 访问 情况 下 的 控制 步 数 。 

操作 符 一 使 用 法 可 以 对 行为 所 需 的 控制 步 数 提供 相当 快速 的 评估 。 如 果 行 为 中 含 及 n 
个 操作 , 则 该 方法 的 计算 复杂 度 为 O(n)。 但 是 , 它 有 出 错 的 可 能 性 ,其 原因 是 该 方法 工作 于 
语句 级 的 粒度 上 ,忽略 了 语句 内 部 各 操作 之 间 的 依赖 关系 。 比 如 ,如 果 有 两 个 具有 一 个 时 钟 周 
期 时 延 的 加 法 器 , 则 采用 该 方法 可 以 得 出 结论 :语句 A:=B+C+D 可 以 在 一 个 控制 步 完成 。 [26 
但 是 ,事实 上 需要 两 个 控制 步 :一 个 用 来 计算 部 分 和 “B + C”, 另 一 个 用 来 将 D 加 入 部 分 和 。 
”总 之 ,如 果 在 系统 描述 中 的 每 个 语句 限定 为 一 个 操作 ,操作 符 - 使 用 法 就 会 产生 更 准确 的 评 
佑 。 

2. 调度 

调度 技术 可 应 用 到 行为 中 以 确定 控制 步 数 。 给 定 资源 约束 ,以 总 控制 步 数 最 小 化 为 目标 
来 调度 行为 中 的 操作 。 在 本 部 分 中 ,我 们 将 讲述 这 样 一 种 具有 资源 约束 的 调度 算法 一 一 列表 
调度 。 有 关 调 度 算法 的 更 全 面 的 讨论 请 见 [GDWL91]。 

对 于 行为 中 每 种 类 型 的 操作 ,列表 调度 算法 都 保持 一 个 优先 表 , 通 过 它 将 操作 分 配 到 控制 
步 中 。 在 任何 一 个 阶段 ,z; 类 型 操作 的 优先 表 包 含 了 一 组 操作 ,该 组 操作 的 前 驱 操 作 均 已 被 调 
度 。 为 执行 某 操作 ,需要 另 一 些 操 作 的 结果 , “前驱 操作 ” 指 的 就 是 这 男 一 些 的 操作 。 因 此 , 某 
操作 的 所 有 前 驱 操 作 必 须 先 于 该 操作 之 前 执行 。 

算法 7.3.3 描述 了 列表 调度 算法 。 和 前 面 一 样 , 设 T 表示 行为 中 操作 的 类 型 数量 ,cstep 
表示 操作 正在 被 调度 的 当前 控制 步 。z; 类 型 操作 的 优先 表 用 plist ( 志 ) 表 示 。 给 定 一 个 表 , K 
数 First 返回 表 中 第 一 个 元 素 , 国 数 Tal 返回 的 是 去 掉 首 个 元 素 后 的 该 表 。 过 程 CreatePrior- 
ityList 对 每 种 操作 类 型 的 优先 表 进 行 初 始 化 ,使 它们 仅 包 含 无 前 驱 的 操作 , 而 过 程 UpdatePri- 
orityList 则 扫描 那些 未 被 调度 的 操作 ,选择 那些 其 前 驱 均 已 被 调度 的 操作 ,并 将 所 选择 的 操作 
加 入 到 适当 的 优先 表 中 。 过 程 UpdateSchedule 通过 将 指定 操作 分 配 到 当前 控制 步 中 以 达到 对 
调度 S 进行 修改 的 目的 。 

算法 中 每 次 迭代 都 对 应 于 对 一 组 操作 的 选择 ,这 组 操作 将 被 分 配 到 当前 控制 步 中 。 如 果 
num(ti) 个 功能 单元 被 分 配给 t; 类 型 操作 ,那么 ,在 每 个 控制 步 ,算法 会 从 相应 优先 表 中 取出 
前 num(z;) 个 操作 分 配 到 当前 控制 步 中 。 每 个 被 分 配 到 当前 控制 步 中 的 操作 都 会 从 优先 表 
中 删除 ,调度 也 将 被 更 新 以 反映 该 次 分 配 的 效果 。 在 所 有 可 能 的 操作 都 被 分 配 到 当前 控制 步 
后 ,优先 表 被 更 新 。 该 算法 反复 执行 直至 给 定 行为 中 的 所 有 操作 都 被 调度 。 行 为 所 需 控制 步 
的 数量 即 为 算法 终止 时 变量 cstep 的 值 。 

算法 7.3.3: 列 表 调 度 


ww 


CreatePriorityList( V , plist (t; ), plist (2),***) 
cstep = 0 
while (( plist (t;)##) or ( plist (t2)##)or--+) loop 
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cstep = cstep + 1 
for : in 1 to T loop 
for j in 1 to num(t;) loop 
if plist (t;) $ then 
UpdateSchedule( S ,First( plist ( t;) ) , estep) 


plist (t;) = Tail( plist (t;)) 
end if 
end loop 
end loop 
UpdatePriorityList( V , plist (11), plist (tz) 1) 


end loop 


列表 调度 中 的 一 个 重要 问题 是 对 合适 的 优先 权 函 数 的 选择 , ARARA OT e+ HY BR 
作 进 行 排 序 。 这 种 优先 权 函 数 是 操作 的 机 动 性 ,定义 为 某 操作 可 能 被 分 配 到 的 控制 步 数 ,并且 
这 种 分 配 不 会 时 延 整个 行为 的 完成 时 间 。 一 个 操作 的 机 动 性 越 低 , 其 调度 优先 级 就 越 高 ,原因 
是 尽早 调度 可 以 使 该 操作 更 早 地 选择 控制 步 。 

虽然 调度 算法 使 设计 者 获得 执行 行为 所 需要 的 准确 的 控制 步 数 ,但 计算 代价 很 高 。 例 如 ， 
列表 调度 的 复杂 度 是 O(n?) ,其 中 n 表示 行为 中 的 操作 数 。 

图 7-13 将 采用 操作 符 — 使 用 法 得 出 的 评估 值 与 采用 基于 机 动 性 的 列表 调度 算法 [Lis92 | 
得 到 的 实际 控制 步 数 进行 了 比较 。 这 些 比 较 是 在 高 层 综 合 中 的 一 些 基 准 实 例 上 ,比如 椭圆 滤 
波 器 [KWK85 ]、 线 相 B 样 条 内 播 滤波 器 [PF89]、 微 分 方程 [PKG86j] 以 及 AR 格 滤波 器 
[JMP88] 进 行 的。 采用 操作 符 -使 用 法 的 平均 误差 仅 为 13%。 


椭圆 滤波 器 
线 相 B 样 条 内 插 滤 波 器 
微分 方程 
AR 格 滤波 器 











图 7-13 采用 操作 符 -使 用 法 和 列表 调度 法 对 控制 步 数 进行 评 信 的 结果 比较 


3. 含有 迭代 与 分 支 结 构 的 行为 

操作 符 一 使 用 法 和 调度 都 可 用 来 评估 直线 代码 所 描述 行为 的 控制 步 数 需 求 。 如 果 一 个 行 
为 具有 分 支 和 和 迭代 结构 , 则 先 将 它 转化 为 一 组 基本 块 。 一 个 基本 块 (basic block)[ASU88 |] 是 指 
一 个 连续 的 HDL 语句 序列 ,其 中 控制 流 从 该 语句 序列 的 开头 流入 ,从 末尾 流出 ,并 且 除 了 在 结 
尾 外 ,不 能 在 中 间 停 止 ,也 不 能 出 现 可 能 的 分 支 。 每 个 基本 块 由 一 组 顺序 赋值 语句 组 成 ,有 时 
称 之 为 直线 代码 。 

在 每 个 基本 块 中 的 控制 步 数 可 采用 以 上 任意 方法 来 确定 。 整 个 行为 的 控制 步 数 则 取决 于 
在 互 斥 分 支 上 的 操作 是 否 共享 相同 的 控制 步 。 

共享 控制 步 (shared control step) :如 果 控 制 步 在 行为 中 的 各 分 支 间 是 共享 的 , 则 该 行为 的 
控制 步 总 数 就 等 于 沿 最 长 路 径 穿越 控制 流 图 所 需 的 控制 步 数 。 对 互 斥 操作 共享 控制 步 会 导致 
控制 单元 中 状态 数 的 减少 。 但 是 ,这 种 实现 需要 有 状态 位 寄存 器 , 它 的 值 用 来 确定 在 任 一 给 定 
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状态 ,这些 互 斥 操作 中 的 哪 一 个 将 被 执行 。 

独立 控制 步 (separate control step) :如 果 在 行为 中 ,不 同 分支 的 操作 被 分 配给 单独 的 控制 
步 , 则 行为 中 控制 步 总 数 就 等 于 每 个 基本 块 所 需要 的 控制 步 数 之 和 。 这 种 实现 将 会 使 控制 单 
元 具有 更 多 的 状态 。 由 于 每 个 控制 步 能 唯一 辨别 出 即将 在 该 控制 步 中 执行 的 操作 ,所 以 不 需 
要 状态 位 寄存 需 。 

举 个 例子 ,我 们 来 看 行为 B 的 控制 流 (control flow) ,其 中 包括 ol 到 og 共 8 个 操作 ,如 图 
7-14a 所 示 。 行为 中 的 操作 被 划分 为 四 个 基本 块 ,BI 到 Bs, 在 图 中 用 虚线 框 指出 。 假 设 由 基 
本 块 By 和 B, 所 表示 的 条 件 分 支 中 ,操作 是 互 斥 的 。 采 用 共享 控制 步 的 调度 如 图 7-14b 所 示 。 
在 该 调度 中 ,尽管 操作 03 和 o6 在 不 同 的 分 支 中 ,但 被 分 配 到 相同 的 控制 步骤 ss 中 。 在 这 种 
情况 下 ,整个 行为 总 共 需 要 6 个 控制 步 。 另 一 方面 ,采用 独立 控制 步 的 调度 则 需要 8 个 控制 步 
又 来 实现 该 行为 ,如 图 7-14c 所 示 。 


L=- 





a) 具有 分 支 的 行为 b) 采用 共享 控制 步 进 行 调度 c) 采用 单独 控制 步 进行 调度 
图 7-14 ”控制 步 评 信 


7.3.4 ”执行 时 间 评 估 

我 们 现在 来 说 明 针 对 一 个 完整 的 功能 描述 中 行为 执行 时 间 的 评估 方法 。 

如 果 一 个 行为 是 用 一 系列 直线 代码 描述 的 , 则 该 行为 自始至终 的 执行 时 间 取 决 于 该 行为 
被 调度 的 控制 步 数 。 设 cstezs (也 ) 表 示 对 行为 B 进行 调度 的 控制 步 数 的 评估 , clk 表示 为 实现 
该 设计 所 选 定 的 时 钟 周期 。 那 么 ,该 行为 的 执行 时 间 ezrectime(B) 计 算 如 下 : 

exectime(B) = csteps( B) X clk (7-13) 

一 般 情 况 下 ,行为 由 顺序 语句 组 成 ,并 有 分 支 和 循环 结构 (如 loops if 和 case 语句 )。 由 
于 分 支 可 能 依赖 于 输入 数据 ,所 以 不 能 直接 用 式 7-13 来 确定 这 种 行为 的 执行 时 间 。 在 这 种 情 
况 下 ,可 采用 一 种 基于 概率 的 流 分 析 技 术 。 

我 们 首先 确定 行为 中 的 基本 块 。 由 于 每 个 基本 块 都 是 由 一 组 顺序 的 赋值 语句 组 成 ,我 们 
可 以 为 每 个 基本 块 确定 执行 时 间 , 方 法 是 先 如 7.3.3 节 所 述 求 出 所 需 控 制 步 数 ,然后 再 应 用 式 
7-13 来 计算 。 

为 确定 整个 行为 的 执行 时 间 , 需 要 确定 每 个 基本 块 b; 的 执行 时 间 exectime (b;) ,再 用 该 基 
本 块 的 执行 频 奉 (execution frequency) 加 权 。 一 个 基本 块 5; 的 执行 频率 freq (6;) 定 义 为 该 基 


本 块 所 属 行为 在 一 次 执行 过 程 中 ,该 基本 块 被 执行 的 平均 次 数 。 一 旦 确定 了 每 个 基本 块 的 执 
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行 频率 , 则 行为 的 总 共 执 行 时 间 exectime(B ) 就 可 用 下 式 评 估 : 
exectime(B) = > exectime(b;) x freq(b;) (7-14) 
b EB 


现在 ,我 们 提出 一 种 方法 以 确定 行为 中 每 个 基本 块 的 执行 频率 。 

基于 概率 的 流 分 析 

为 了 计算 每 个 基本 块 的 执行 频率 ,我 们 必须 首先 为 行为 中 的 基本 块 创建 等 价 的 控制 流 图 
模型 。 设 G=(V,E) 为 一 个 图 ,其 中 VV 表示 顶点 六 的 集合 ,E 表示 连接 顶点 By 的 有 向 
W e; 的 集合 H o 

对 于 行为 描述 中 的 每 个 基本 块 5b; ,在 图 G 中 都 对 应 一 个 顶点 v;。 条 件 语句 (if、case 或 
loop) 的 目标 块 是 指 对 条 件 求 值 后 ,控制 可 能 被 传递 到 的 任何 基本 块 。 对 于 任意 一 个 基本 块 
6b; ,如 果 它 是 紧 随 基 本 块 5; 之 后 的 条 件 语 句 的 目标 块 , 则 在 G 中 有 一 条 从 顶点 wv 指向 vw A 
Wey. 

在 得 到 了 行为 的 控制 流 图 后 ,我们 就 可 以 采用 基于 分 支 概 率 的 流 分 析 法 确定 每 个 结 点 的 
执行 频率 。 

分 支 概率 是 在 对 某 分 支 语 句 的 条 件 求 值 后 ,对 某 分 支 执行 频率 的 一 个 度量 。 分 支 概率 可 
通过 若干 种 途径 来 确定 。 第 一 ,可 以 用 静态 的 方式 计算 概率 。 对 于 迭代 次 数 n 已 知 的 循环 语 
句 的 情况 , 则 在 控制 流 图 中 ,循环 的 边 被 赋予 概率 (nn -1)/n, 而 退出 循环 的 边 被 赋予 概率 
1/n。 对 于 其 他 的 分 支 状态 如 if 或 case, 则 可 对 每 个 分 支 赋予 相等 的 概率 。 第 二 ,设计 者 可 采 
用 在 设计 描述 中 加 入 注解 或 在 运行 时 进行 交互 的 方式 ,直接 在 行为 的 分 支 结构 中 指定 概率 。 
第 三 ,概率 可 动态 地 获得 ,方法 是 在 若干 种 样本 数据 集 上 对 行为 进行 模拟 ,记录 下 各 个 分 支 被 
执行 的 频率 ,并 因此 得 出 每 个 分 支 的 概率 。 | 

我 们 现在 可 以 通过 分 析 控 制 流 图 中 边 的 执行 概率 来 确定 各 结 点 的 执行 概率 。 其 过 程 概 述 
如 下 : 

1) 在 给 定 控制 流 图 中 的 第 一 个 结 点 之 前 加 入 一 个 开始 结 点 S。 由 于 该 结 点 仅仅 在 控制 
流 图 被 执行 时 才 执行 1 并 eH SCR freq(S) 设 为 1 

2) 任何 一 个 结 点 ww 的 执行 频率 取决 于 其 所 有 直接 前 趋 结 点 的 加 权 执 行 频率 。 每 个 前 趋 
结 点 v 的 加 权 执 行 频率 是 将 其 执行 频率 乘 以 和 之 间 边 的 分 支 概率 prob (e; )。 我 们 首先 
将 图 中 每 个 结 点 的 执行 频率 用 方程 表示 出 来 。 对 于 控制 流 图 中 的 任 一 绪 氮 n 

freq(n;) = DPA freq ni ) x prob le;;) (7-15) 


3) 由 上 一 步 表 示 的 线 性 方程 组 可 用 高 斯 消去 法 或 LU 因子 分 解 等 方法 得 到 各 结 点 的 执 
行 频率 。 这 些 也 就 是 行为 中 相应 基本 块 的 执行 频率 。 

我 们 以 图 7-15a 所 示 的 VHDL 行为 为 例 来 说 明基 于 概率 的 流 分 析 法 。VHDL 语句 的 基本 
模块 如 图 7-15b 所 示 。 对 于 行为 中 的 每 个 基本 块 , 在 图 7-15c 的 控制 流 图 中 都 有 一 个 项 点。 如 
果 控 制 可 在 相应 的 基本 块 中 传递 的 话 , 则 在 这 两 顶点 间 存 在 一 条 边 。 例 如 ,如 果 条 件 D>A 
为 真 ,控制 就 可 以 从 基本 块 B, 到 B, 传递 。 这 样 ,在 顶点 wz 和 vs 之 间 存 在 一 条 边 ezo 
外 ,还 增加 了 一 个 虚 起 始 结 点 S。 | 

在 图 7-15c 中 还 标识 出 在 结 点 w 和 vs 处 的 分 支 概 率 。 我 们 现在 可 以 用 方程 来 表示 出 控 
制 流 图 中 各 结 点 的 执行 频率 。 例 如 , 结 点 uv 有 两 个 前 趋 结 点 v1 和 vs。 结 点 vi 每 执行 一 次 
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的 时 间 为 结 点 vo 执行 一 次 的 时 间 加 上 结 点 vs 执行 时 间 的 0.9 倍 。 因 此 


ASAHI; 
for lin 1 to 10 loop 
B:=B+1; 
C:=C-A; 
if(D > A)then 
D:=D+2; 


E:=D*2; 
end loop: 


B:=B *A; 
C:=3:; 





c) 等 价 的 带 有 概 


a) VHDL 上 顺序 语句 
率 的 控制 流 图 


图 7-15 构造 行为 的 控制 流 图 


freq(v2) =1% freqg(wvi) +0.9X freq( vs) 

继续 用 类 似 的 方式 来 看 图 7-15c 中 的 其 他 结 点 ,我 们 得 到 如 下 方程 组 ; 
freq(S)=1.0 
freq(v,) =1.0% freq(S) 
freq( v2) =1.0% freqg (vi) +0.9%X freg (vs) 
freq( v3) =0.5X freq( v2) 
freq(v4) =0.5X freq(v2) 
freq( us) =1.0X freqg(v3) +1.0% freg(v4) 
freq( vg) =0.1% freq(vs) 

通过 对 得 到 的 线性 方程 组 求解 ,就 可 求 出 图 中 所 有 结 点 的 执行 频率 : 


freqg(u;,) =1.0 freg (vz) =10.0 
freq(v3)=5.0 freq(v4) =5.0 
freq( vs) =10.0 freq( vg) =1.0 


一 旦 确定 了 每 个 基本 块 的 执行 频率 , 即 可 应 用 方程 7-14 求 出 整个 行为 的 执行 时 间 。 

在 上 述 方法 中 ,我们 是 通过 对 每 个 结 点 赋予 相应 基本 块 的 执行 时 间 ,并 进行 流 分 析 来 获得 
整个 行为 的 执行 时 间 。 通 过 对 控制 流 图 中 每 个 结 点 赋予 不 同类 型 的 信息 ,基于 概率 的 流 分 析 
也 可 用 于 确定 其 他 有 用 的 设计 特性 。 比 如 ,如 果 控 制 流 图 中 的 每 个 结 点 表示 在 相应 的 基本 块 
中 存储 器 访问 的 次 数 ,那么 流 分 析 将 得 出 在 整个 行为 执行 期 间 存 储 器 访问 的 平均 次 数 。 类 似 
地 ,如果 我 们 对 每 个 结 点 赋予 某 过 程 在 基本 块 被 调用 的 次 数 , 就 可 以 确定 整个 行为 对 该 过 程 的 
调用 次 数 。 最 后 ,通过 对 每 个 结 点 赋予 数据 在 相应 基本 块 中 通道 上 的 传输 次 数 , 流 分 析 将 得 出 
整个 行为 对 通道 访问 的 总 次 数 。 

7.3.5 通信 速率 评估 
通信 通道 或 者 在 行为 描述 中 明确 地 规定 ,或 者 当 某 个 变量 被 某 行为 访问 时 生成 (该 行为 在 
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系统 划分 过 程 中 被 分 配 到 不 同 于 该 变量 所 在 的 芯片 )。 并 发 行为 之 间 通 信 的 平均 传输 速率 和 


最 高 传输 速率 在 7.2.3 节 中 已 定义 。 行为 B 针对 通道 C 的 平均 访问 次 数 access (B,C) 可 采用 
上 一 节 介 绍 的 流 分析 方 法 来 计算 。 
设 bits(C) 表 示 单 个 消息 中 通过 通道 C 进行 接收 或 发 送 的 位 数 。 如 果 一 个 行为 正 通 过 通 
道 访问 一 个 数组 变量 , 则 bits (C) 也 包括 了 地 址 的 大 小 。 例 如 ,如 果菜 个 行为 分 别 通过 通道 
chX 和 chY 访问 一 个 16 位 标量 X 和 32 字 x 16 位 的 数组 变量 Y, 则 bits (chX) 为 16, 而 
bits(chY) 为 21(5 位 地 址 和 16 位 数据 )。 
在 行为 B 的 生存 期 内 ,通过 通道 C 发 送 的 总 位 数 如 下 计算 : 
total bits(B,C)=access (B,C) X bits(C) (7-16) 
任何 行为 的 总 执行 时 间 都 包括 两 部 分 :计算 时 间 和 通信 时 间 。 
计算 时 间 (computation time) , 即 comptime(B)# LARA B 执行 其 内 部 计算 所 需 时 间 。 
这 些 计算 表现 了 行为 中 诸如 赋值 .循环 及 条 件 语句 的 执行 。 
通信 时 间 (communication time) 定 义 为 某 行为 访问 该 行为 外 部 数据 所 需 时 间 。 这 种 通信 
可 表现 出 通过 通道 对 其 他 行为 中 变量 的 访问 。 行为 B 通过 通道 C 传输 数据 所 需 通信 时 间 记 
为 commtime (B,C)。 | 
计算 时 间 可 采用 前 一 节 中 讲述 的 流 分 析 法 计算 出 来 。 以 下 我 们 将 给 出 对 于 通信 速率 进行 
评估 的 公式 。 设 protdelay(C) 表 示 通 过 通道 C 传输 单个 消息 的 时 延 。 为 简化 表达 ,假设 行为 
B 仅 有 一 个 通道 C ,要 么 接收 数据 ,要 么 发 送 数据 , 则 该 行为 的 通信 时 间 commtime (B,C) tr 
算 如 下 : | 
commtime (B,C) = access( B,C) X protdelay(C) (7-17) 
通道 C 的 平均 数据 传输 速率 avgrate(C) 可 如 下 确定 : 
total _bits( B,C) (7-18) 


avgrate ( C= com ptime(B) + commtime( B,C) 


通道 的 最 高 传输 速率 则 为 : 


peakrate(C) = —bitstC) (7-19) 


protdelay( C) 
7.3.6 面积 评估 

对 任何 设计 的 大 小 进行 评估 的 首要 任务 是 确定 实现 给 定 行为 所 需 组 件 的 数量 和 类 型 。 一 
日 所 需 组 件 得 到 确定 ,我 们 就 可 以 获得 多 种 技术 条 件 下 的 尺寸 评估 。 例 如 ,对 于 一 个 FPGA 
的 实现 ,对 设计 中 采用 的 组 合 逻 辑 块 (combination logic block，CLB) 总 数 的 评估 可 以 通过 将 设 
计 中 每 个 组 件 采用 的 CLB 数目 相 加 得 到 。 对 于 一 个 门 阵列 的 实现 ,设计 复杂 度 可 以 通过 将 组 
件 所 需 等 价 门 的 数目 相 加 得 到 。 对 于 全 定制 的 实现 ,设计 大 小 可 采用 所 有 组 件 中 晶体 管 的 数 
目 来 近似 ,或 者 采用 组 件 布 图 和 布局 后 边界 框 的 面积 来 近似 。 

在 本 节 中 ,我 们 将 讲述 确定 组 件数 量 的 技术 ,这 些 组 件 是 为 实现 功能 描述 所 需 。 如 7.3.1 
节 所 述 的 那样 ,假定 给 定 行为 被 实现 为 具有 一 个 控制 单元 和 一 个 数据 通路 的 FSMD 一 一 对 控 
制 单元 和 数据 通路 的 评估 将 分 别 讨论 。 作 为 一 个 例子 ,我 们 还 讲述 了 对 于 全 定制 实现 的 总 布 
图 面积 的 评估 方法 。 同 样 的 方法 也 可 以 应 用 到 其 他 门 阵 列 和 FPGA 技术 中 。 

1. 数据 通路 

数据 通路 包含 三 种 RT 组 件 :存储 单元 (如 寄存 器 和 锁 存 器 )、 功 能 单元 (如 ALU 和 比较 
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了 。 在 这 一 部 分 ,我们 将 介绍 用 于 评估 这 些 组 件 的 数量 、 大 小 和 面积 的 技术 。 

存储 单元 用 来 保存 行为 中 常量 、 变 量 和 数组 的 数据 值 。 最 简单 的 评估 策略 是 假设 行为 中 
的 每 个 变量 由 独立 的 寄存 顺 或 存储 器 实现 。 但 是 ,这 样 的 实现 可 能 会 导致 大 量 元 余 的 存储 单 
元 出 现 ,因为 在 整个 行为 执行 过 程 中 好 多 变量 的 值 是 不 需要 的 。 通 过 将 不 同时 使 用 的 若干 个 
变量 映射 到 同一 个 寄存 器 或 存储 器 ,使 存储 单元 数量 达到 最 小 化 是 可 行 的 。 为 确定 两 个 变量 
是 否 同 时 被 使 用 ,我 们 必须 考虑 它们 的 生存 期 。 一 个 变量 的 生存 期 (lifetime) 定 义 为 从 该 变量 
的 定义 ( 写 人 该 变量 ) 到 它 的 下 一 定义 前 的 最 后 一 次 使 用 ( 读 该 变量 的 值 ) 之 间 的 时 间 间 隔 。 一 
个 设计 中 所 需 存储 单元 的 数量 与 交友 的 变量 生存 期 的 最 大 数量 相等 。 考 察 图 7-16a 例子 中 被 
调度 的 行为 ,包含 从 vi 到 zl 这 些 变量 。 每 个 变量 的 生存 期 如 图 7-16b 所 示 。 变 量 va 在 状态 
si 中 计算 为 v 与 v 之 和 ,在 状态 ss 最 后 一 次 被 加 法 操作 使 用 以 计算 ve。 因此 ,变量 va 在 
状态 so 和 s3 中 是 “活跃 ”的 。 


Vi V2 V3 Vy Vs Ve Vo Ya Vo Vio Yu 
So 


人 





ees 








a 


S$s 


VI V2 ] | 
a) 调度 的 行为 b) 生存 期 间隔 
K 7-16 变量 的 生存 期 


一 旦 变量 的 生存 期 计算 出 来 ,就 可 采用 若干 种 方法 来 确定 实现 这 些 变量 所 需 的 存储 单元 
数 。 团 划分 (clique partitioning) 方 法 可 用 于 确定 能 映射 到 同一 个 存储 单元 的 变量 集合 。 图 G 
=(V,E) 起 源 于 给 定 的 行为 ,在 该 行为 中 每 个 顶点 v;E V 唯一 表示 一 个 变量 vw;, 而 且 仅 仅 当 
变量 w Flv; 可 以 存 人 相同 存储 单元 ,也 就 是 说 它们 的 生存 期 间隔 互 不 交叉 时 ,其 对 应 的 结 点 
间 也 存在 一 条 边 e;,;E EE。G 的 一 个 完全 子 图 或 团 (clique) 表 示 该 子 图 中 所 有 变量 的 存储 单 
元 。 为 寻找 最 少数 目的 存储 单元 ,我 们 必须 将 图 G 划分 为 最 小 数量 的 团 , 每 个 顶点 仅 属 于 一 
个 团 ,该 问题 被 称 为 团 划 分 [CLR89j。 

我 们 简要 介绍 解决 团 划分 问题 的 一 种 启发 式 算法 [CS86]。 该 方法 包含 寿 干 迭代 ,每 个 达 
代 中 具有 最 多 公共 相 邻 结 点 的 一 对 结 点 被 合并 为 一 个 结 点 。 从 其 他 结 点 到 这 两 个 结合 的 绪 氮 
的 边 被 到 达 新 结 点 的 边 所 代替 。 不 断 重 复 这 样 的 合并 结 点 过 程 ,直至 图 中 没有 边 , 从 而 导致 一 
组 团 的 生成 。 每 个 团 对 应 于 一 个 存储 单元 ,该 单元 将 实现 属于 该 团 的 变量 。 

我 们 下 面 针对 一 个 行为 来 示范 团 划 分 方法 ,该 行为 中 所 有 变量 的 生存 期 在 图 7-16b Pa 
出 。 图 7-17a 示 出 该 组 变量 的 图 模型 ,并 适当 地 在 顶点 间 添 加 了 边 。 例 如 ,由 于 vs 和 vio 的 生 
存 期 并 不 交叉 ,因此 它们 代表 的 顶点 间 存 在 一 条 边 ; 而 顶点 vi 和 vio 之 间 没 有 边 是 因为 它们 
的 生存 期 出 现 了 交叉 。 因 此 ,运用 上 述 的 团 划 分 启发 式 方法 ,我们 可 以 如 图 7-17b 所 示 创 建 五 
个 团 并 分 别 分 配 到 寄存 器 R1 到 R5。 


ho 
ON 





150 B7t 


团 存储 单元 
{V3,¥3} = RI 
{Vg,VpVot = R2 


{VYY =R 
{Viovill} = R4 
{vi} = R5 





b) 团 划 分 的 解 





c) 应 用 左边 算法 后 d) 产生 的 变量 到 存储 
的 交叉 生存 期 单元 间 的 映射 


图 7-17 寄存 器 分 配 


另 一 个 启发 式 团 划分 策略 基于 左边 算法 (left-edge algorithm)[HS71], 目 的 是 使 REAL 中 
寄存 器 的 数量 最 小 化 [KP87]。 行为 中 给 定 的 一 系列 变量 及 其 相应 的 生存 期 间隔 ,该 算法 首先 
按照 这 些 变量 生存 期 开始 时 刻 的 先后 顺序 将 其 按 升 序 排列 。 算 法 对 已 排序 的 列表 进行 奉 干 次 
扫描 ,并 按 它们 在 列表 中 的 顺序 来 检查 这 些 变量 的 生存 期 。 在 每 次 扫描 中 ,该 算法 都 分 配 一 个 
新 的 寄存 器 并 指派 一 新 的 变量 到 该 寄存 器 ,条 件 是 该 变量 的 生存 期 与 已 指派 给 该 寄存 疮 的 所 
有 变量 的 生存 期 不 能 出 现 交叉 。 这 些 被 指派 的 变量 随后 就 在 变量 有 序列 表 中 被 删除 。 该 过 程 
BRAT HEI AS SS OBR Ba RE AIL. 

为 了 举例 说 明 左 边 算法 ,我 们 将 其 应 用 于 图 7-16 中 被 调度 的 行为 。 首 移 将 这 些 变量 按照 
生存 期 间隔 来 排序 ,产生 序列 工 = (v, U2, U4, U6» U10 U3, U5, U7, Ug, V9, v11)。 在 第 一 次 扫描 
中 ,存储 单元 Ri 被 分 配 并 将 变量 o 指派 给 它 ;扫描 序列 工 ,我们 发 现 可 以 指派 给 存储 单元 
R1 的 下 一 个 变量 是 vg, 因 为 它 的 生存 期 间隔 与 已 指派 给 R1 的 变量 vi 不 交叉 ;而 其 他 的 变 
量 的 生存 期 都 与 变量 v, 和 vs 出 现 了 交叉 。 因 此 ,存储 单元 R 只 包括 变量 vi 和 vs ,并 将 L 
中 的 v, 和 vs 删除。 在 第 二 次 扫描 中 ,存储 单元 R2 被 分 配 并 将 vs 指派 给 它 。 扫 描 该 序列 
了 ,可 以 发 现 变 量 v3 和 vo 也 可 以 指派 给 R2。 类 似 地 重复 执行 ,总 共 需 要 5 次 对 工 的 扫描 才 
能 将 所 有 变量 指派 给 存储 单元 。 图 7-17c 显示 出 左边 算法 的 $ 次 迭代 过 程 中 各 个 变量 的 生存 
期 ,而 图 7-17d 显示 了 将 变量 指派 给 寄存 器 的 最 终结 果 。 

比 起 假设 每 个 变量 配置 一 个 存储 单元 的 做 法 ,上 面 的 方法 能 对 行为 中 所 需 存储 单元 数目 
做 出 更 精确 的 评估 。 但 是 ,以 上 两 种 方法 的 精确 评估 都 是 建立 在 大 量 额 外 计算 的 基础 上 的 。 
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功能 单元 (functional unit) 用 来 实现 行为 中 的 操作 。 对 所 需 功 能 单元 数量 的 评估 可 采用 若 

于 种 方法 。 
首先 ,系统 设计 者 需要 明确 说 明 功 能 单元 的 配置 。 

其 次 ,如果 行为 已 经 按时 间 调 度 为 几 个 控制 步 ,那么 可 以 采用 团 划分 方法 [CS86j] 来 确定 
所 需 功能 单元 的 数量 。 该 方法 包括 图 模型 的 构造 ,这 与 介绍 过 的 确定 存储 单元 数量 的 方法 类 
似 。 图 中 每 个 结 点 代表 行为 中 的 一 个 操作 。 当 和 且 仪 当 相 应 操作 被 指派 到 不 同 的 控制 步 中 ,而 
同时 有 某 一 功能 单元 能 完成 这 两 种 操作 时 ,两 个 结 点 间 就 会 存在 一 条 边 。 该 图 中 的 团 表 示 可 
以 被 相同 功能 单元 执行 的 操作 和 集合。 前 一 部 分 所 述 的 启发 性 算法 则 可 确定 必要 的 功能 单元 的 
数量 。 

最 后 ,如 果 为 行为 规定 了 性 能 约束 (比如 最 大 控制 步 数 ) ,实现 行为 所 需 的 功能 单元 的 最 小 
数量 可 采用 力 指 向 算法 (force-directed algorithm)! PK89b 来 确定 。 该 算法 力图 将 相同 类 型 的 
控制 均匀 分 配 至 所 有 可 得 到 的 控制 步 中 。 这 种 均匀 分 配 保证 分 配给 一 个 控制 步 的 功能 单元 在 
所 有 其 他 控制 步 中 可 以 得 到 有 效 利 用 ,并 产生 高 的 功能 单元 利用 率 。 在 每 次 迭代 中 ,该 算法 仅 
分 配 一 个 未 调度 的 操作 至 一 个 控制 步 中 ,以 减少 设计 中 预期 的 功能 单元 数量 。 当 算法 终止 后 ， 
分 配给 任何 控制 步 的 特定 类 型 操作 的 最 大 数量 就 是 所 需 的 该 类 型 功能 单元 的 需求 数量 。 与 团 
划分 不 同 , 力 指向 方法 要 求 进 行 功能 单元 绑 定 (functional-unit binding) ,即将 行为 中 的 操作 指 
派 给 特定 的 功能 单元 。 这 种 操作 到 功能 单元 的 映射 具有 本 质 意义 ,因为 它 能 使 我 们 确定 存储 
单元 与 功能 单元 之 间 所 需 互联 数量 。 

在 行为 中 所 有 变量 和 操作 都 被 映射 到 存储 单元 和 功能 单元 之 后 ,我 们 就 可 以 对 互联 单元 
(interconnect unit) 的 数量 进行 评估 了 ,如 用 于 连接 存储 单元 和 功能 单元 的 总 线 和 多 路 选择 器 。 
用 总 线 实现 的 优点 是 易 布线 ,因为 每 条 总 线 一 般 连接 着 一 系列 通信 的 单元 。 当 一 存储 单元 或 
功能 单元 使 用 总 线 读 写 数 据 时 仅 需 要 一 很 短 的 连接 就 可 以 接 人 总 线 。 另 一 方面 ,用 多 路 选择 
器 实现 可 能 导致 拥塞 ,因为 要 求 所 有 输入 传送 至 一 个 多 路 选择 器 组 件 中 去 。 

针对 互联 单元 的 评估 可 以 分 别 从 行为 描述 中 和 从 变量 和 操作 到 寄存 器 和 功能 单元 的 映射 
中 直接 得 到 。 

首先 ,确定 设计 中 存储 单元 和 功能 单元 之 间 的 互联 集合 。 例 如 ,如 果 一 行为 具有 语句 A : 
= B + CRAMER B 和 变量 C 被 分 配 的 存储 单元 到 执行 加 法 操作 的 功能 单元 间 就 存在 着 
连接 ,同样 ,功能 单元 到 存储 A 的 存储 单元 间 亦 有 一 条 连接 。 

一 日 这 些 连接 已 经 确定 ,就 需要 将 它们 映射 到 一 多 路 选择 器 或 一 总 线 中 去 。 一 个 简单 的 
策略 是 实现 一 组 连接 ,该 组 连接 具有 共同 的 接收 器 ,该 接收 器 是 指 同一 个 多 路 选择 器 或 一 总 
线 。 图 7-18a 显示 出 了 一 组 寄存 器 和 一 个 功能 单元 的 两 个 输入 之 间 的 连接 。 由 于 每 个 功能 单 
元 具有 四 个 输入 端 ,那么 就 需要 两 个 4x1 多 路 选择 器 M1 和 M2 来 实现 该 连接 ,如 图 7-18b 
所 示 。 通 过 分 解 出 至 不 同 多 路 选择 器 的 共同 输入 ,并 插入 另外 的 多 路 选择 器 对 这 些 共 同 输入 
选择 其 一 ,就 可 以 达到 降低 多 路 选择 器 成 本 的 目的 。 例 如 ,图 7-18b 中 的 多 路 选择 器 M1 和 
M2 都 具有 来 自 于 寄存 器 R2、R3 和 R4 的 输入 。 从 这 些 寄存 器 到 功能 单元 的 两 个 输入 端 之 
间 的 连接 可 以 分 解 出 来 ,由 多 路 选择 器 M3 实现 ,如 图 7-18c 所 示 。 分 解 多 路 选择 器 输入 的 条 


略 降低 了 设计 中 多 路 选择 器 输入 的 总 数 ,也 就 降低 了 多 路 选择 器 的 成 本 。 例 如 ,图 7-18b 中 的 


两 个 多 路 选择 器 的 输入 总 数 为 8, 而 图 7-18c 中 三 个 多 路 选择 器 的 输入 总 数 则 仅 为 7。 
另 一 个 评估 连接 单元 数量 的 途径 是 采用 团 划分 方法 。 这 里 要 构造 的 图 模型 与 前 面 介绍 的 
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用 以 确定 存储 单元 和 功能 单元 数量 的 模型 相似 。 图 中 每 个 顶点 表示 两 个 单元 间 的 一 个 连接 。 
两 顶点 间 存 在 边 当 且 仅 当 相应 的 连接 并 不 在 相同 控制 步 中 并 发 使 用 进行 数据 传输 。 该 图 中 的 
每 个 团 表示 一 个 互联 单元 。 一 个 困 中 所 有 顶点 所 代表 的 所 有 连接 都 将 被 分 配 至 相同 的 多 路 选 
择 器 或 总 线 上 。 

图 7-18d 显示 出 在 进行 了 团 划 分 后 ,采用 两 条 总 线 实现 了 图 7-18a 中 的 连接 。 当 两 条 或 更 
多 总 线 需要 被 连接 到 相同 的 单元 时 ,仍然 需要 多 路 选择 器 ,从 而 导致 两 级 互联 结构 。 在 图 
7-18d 中 ,总 线 B1 和 B2 都 通过 多 路 选择 器 M1 连接 到 了 功能 单元 的 输入 11。 对 于 任何 设 
计 , 存 储 单元 与 功能 单元 间 的 互联 可 能 会 采用 多 级 互联 单元 实现 。 可 采用 总 线 或 多 路 选择 天 
来 实现 在 任意 一 个 级 别 上 的 互联 。 





a) 存储 单元 与 功能 单元 间 的 互联 b) 多 路 选择 器 实现 





c) 通过 分 解 减少 多 路 选择 器 输入 d) 团 划 分 后 的 两 级 互联 
图 7-18 ”确定 互联 单元 


到 此 已 讲述 了 如 何 对 数据 通路 中 的 存储 、 功 能 以 及 互联 单元 进行 评估 的 方法 ,我 们 现在 
就 来 看 如 何 对 一 个 定制 的 ASIC 实现 来 确定 其 数据 通路 的 总 面积 。 相 同 的 公式 经 过 简单 地 调 
整 也 可 用 于 门 阵列 和 FPGA 的 实现 。 

2. 数据 通路 面积 的 评估 

数据 通路 的 版 图 通常 是 一 个 位 切片 堆 (bit-sliced stack)[WCG91j ,其 中 单独 的 数据 通路 组 
件 放置 成 排 ,一 个 挨 着 一 个 ,并 使 得 每 个 单元 的 最 低 有 效 位 (least-significant-bit,LSB) 的 位 置 对 
齐 。 该 结构 如 图 7-19 所 示 。 一 个 布线 通道 用 于 连接 同一 个 位 切片 内 的 不 同 单元 。 控 制 线 水 
平地 布 在 第 二 金属 层 与 电源 层 上 ,数据 线 垂直 地 布 在 多 晶 硅 层 或 第 一 金属 技 上 。 

为 确定 数据 通路 的 面积 ,我 们 需要 确定 一 个 位 切片 的 总 长 度 Lu 和 高 度 丽 zs。 假 设 Lo 与 
每 个 位 切片 中 晶体 管 数量 成 比例 ,我 们 首先 来 确定 数据 通路 中 每 个 位 切片 中 的 晶体 管 数量 
(DP), $ RM 分别 是 为 数据 通路 确定 的 寄存 器 、 功 能 单元 及 多 路 选择 器 的 数量 。 令 
tr(REG;)、tr(FU;)、tr(MUX ) 分 别 表示 位 切片 中 第 i 个 寄存 器 、 第 ; 个 功能 单元 .第 & 个 多 
路 选择 器 中 晶体 管 的 数量 ,那么 在 每 个 位 切片 中 晶体 管 的 数量 可 以 计算 如 下 : 
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tr(DP) = X) ir (REG; e > er( FU, i+ >) tr (MUX,) (7-20) 


wa 为 以 wm/ 晶体 管 为 单位 表示 的 晶体 管 间距 系数 。 对 于 一 个 给 定 的 库 ， a 可 通过 求 库 
中 每 个 单元 的 宽度 和 晶体 管 数 之 比 的 平均 值 来 获得 。 如 图 7-19 所 示 , 每 个 位 切片 的 总 长 度 可 
由 下 式 求 得 : 
Ler = a X tr( DP) (7-21) 


位 切片 


布线 通道 l 
MSB | ral LSB 


控制 线 





ae 


图 7-19 以 位 切片 堆 的 形式 排列 的 数据 通路 组 件 


在 位 切片 中 ,每 个 单元 的 高 度 Hw 是 固定 的 且 取 决 于 库 中 标准 单元 的 高 度 。 与 每 个 位 切 
片 相关 的 布线 通道 的 高 度 态 , 则 取决 于 为 实现 数据 通路 组 件 间 的 线 网 连接 所 需 的 布线 轨道 
数 。 对 每 个 位 切片 中 所 需 轨 道 数 的 估计 只 能 在 该 位 切片 中 每 个 单元 的 位 置 确定 之 后 才能 获 
得 。 最 小 割 算 法 (min-cut algorithm)[FM82] 可 用 于 该 目的 。 所 需 的 轨道 数 可 估计 为 跨越 垂直 
于 通道 的 切割 线 的 最 大 连接 数 。 采 用 简单 的 布线 算法 可 获得 更 好 的 评估 , 如 左边 算法 
[HS71] ,具有 O(nlogn ) 的 复杂 度 , 其 中 ”表示 线 网 数 。 
一 个 较 简单 的 方法 ,需要 知道 同一 轨道 上 能 实现 的 平均 线 网 数 nets _ per _ track ,该 值 可 [283 
通过 经 验 确 定 。 设 PARE, , 即 两 条 金属 线 之 间 的 最 小 间隔 。 设 n 表示 数据 通路 中 组 件 之 
间 的 线 网 数 。 那 么 ,布线 通道 的 高 度 五 "可 由 下 式 计 算 : 


7 nets : 
rt “nets _ per _track ič ee) 


这 样 ,每 一 个 位 切片 的 面积 area (bit ) 可 以 计算 如 下 : 
area( bit ) = Lya X (Heu + Hn) (7-23) 


最 后 , 若 bitwidth ( DP) 表示 数据 通路 组 件 的 位 宽 , 那 么 数据 通路 总 面积 计算 为 : 
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area( DP ) = bitwidth ( DP ) X area ( bit ) | (7-24) 

3. 控制 单元 面积 评估 

控制 单元 通过 一 系列 的 控制 步 或 状态 对 设计 确定 时 序 ,其 中 每 一 步 表示 一 组 能 并 发 执行 
的 数据 通路 操作 。 

控制 单元 包括 状态 寄存 器 .控制 逻辑 以 及 次 态 逻 辑 。 状 态 寄存 器 用 于 存储 经 过 编码 后 的 
状态 。 控 制 逻辑 对 数据 通路 组 件 定 义 了 控制 信号 ,其 表现 形式 为 当前 状态 的 一 个 函数 。 次 态 
逻辑 定义 了 状态 机 的 下 一 个 状态 ,其 表现 形式 为 当前 状态 和 数据 通路 状态 线 的 一 个 函数 。 数 
据 通 路 状态 线 将 数据 通路 中 比较 操作 的 结果 传送 到 控制 逻辑 。 | 

评估 行为 所 需 状态 数 的 方法 在 7.3.3 节 中 有 所 介绍 。 如 果 一 设计 具有 N 个 控制 步 , 那 么 
状态 寄存 器 的 位 宽 bitwidth (SR ) 将 会 是 log No 

控制 单元 与 次 态 逻 辑 单元 可 能 的 实现 形式 有 随机 逻辑 .只 读 存 储 器 (ROM) 或 可 编程 逻 辑 
阵列 (PLA)。 在 本 部 分 中 ,我 们 将 讲解 与 随机 逻辑 和 ROM 实现 相关 的 评估 技术 。 对 用 PLA 
实现 的 控制 单元 的 面积 评估 技术 已 在 LGDWL91] 进 行 了 讨论 。 

图 7-20 所 示 的 是 用 随机 还 辑 实 现 的 控制 逻辑 和 次 态 逻 辑 ,该 随机 逻辑 是 用 与 门 和 或 门 组 
成 的 二 级 网 络 实现 的 。 为 了 对 该 控制 单元 的 面积 做 出 评估 ,我们 首先 需要 确定 与 门 和 或 门 的 
数量 和 大 小 ,以 及 为 实现 控制 单元 所 需要 的 驱动 器 。 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
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数据 通路 状态 位 线 
图 7-20 “控制 单元 的 两 级 与 /或 门 实现 


控制 单元 通常 被 描述 成 一 个 状态 表 , 该 表 对 数据 通路 组 件 中 的 每 个 状态 定义 了 控制 信 
号 。 为 了 确定 控制 单元 所 需 的 门 的 总 数 ,可 以 为 每 个 控制 或 次 态 列表 产生 布尔 方程 并 对 其 进 
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行 优 化 。 但 是 ,由 于 产生 一 个 状态 表 将 布尔 方程 用 公式 表示 、 优 化 这 些 公 式 等 过 程 都 是 非常 
FEIN AY ,因此 就 需要 另外 的 对 控制 单元 面积 进行 评估 的 方法 。 我 们 现在 就 描述 这 样 一 个 方法 ， 
该 方法 能 对 一 个 用 随机 逻辑 实现 的 控制 单元 评估 其 所 需要 的 门 的 数量 和 大 小 。 

考虑 图 7-20 所 示 的 控制 单元 。 由 于 每 个 控制 线 和 次 态 线 都 需要 一 个 或 门 , 所 以 或 门 的 总 
数 应 等 于 控制 线 与 次 态 线 的 数量 。 对 于 一 条 控制 线 而 言 ,一 个 或 门 的 大 小 (输入 端的 个 数 ) 等 
于 该 控制 线 起 作用 的 那些 控制 步 的 数目 。 例 如 , 当 某 数据 值 置 人 寄存 器 时 ,用 于 驱动 寄存 器 置 
入 线 的 控制 线 C; 就 起 作用 。C; 起 作用 的 次 数 可 以 通过 在 系统 描述 中 检查 存储 在 该 寄存 器 中 
的 任何 变量 被 赋予 新 值 的 次 数 得 到 。 与 此 类 似 ,只 要 一 个 功能 单元 要 执行 一 个 分 配给 它 的 操 
作 , 则 使 该 功能 单元 动作 的 控制 线 就 起 作用 。 如 果 不 止 一 个 给 定 类 型 的 功能 单元 被 指派 ,那么 
某 个 控制 线 起 作用 的 控制 步 数 就 可 以 估计 为 该 种 类 型 操作 的 数量 对 功能 单元 的 数量 求 平均 。 
考虑 到 选择 线 的 二 进 制 编码 的 情况 ,对 于 n x1 多 路 选择 器 的 low (nn ) 条 选择 线 , 以 及 该 多 路 
选择 器 为 之 选择 数据 的 存储 和 功能 单元 ,可 以 认为 每 个 选择 线 在 这 些 存储 和 功能 单元 的 一 半 
状态 中 是 活跃 的 。 为 了 为 次 态 线 确 定 或 门 的 大 小 ,我 们 假设 每 个 次 态 线 平均 在 设计 中 一 半 的 
控制 步 中 进行 了 “翻转 ”。 这 样 ,驱动 次 态 线 的 每 个 或 门 的 大 小 就 假定 为 控制 步 数 的 一 半 。 

需要 用 与 门 对 状态 寄存 器 SR 中 的 值 所 代表 的 当前 状态 进行 解码 。 控 制 逻辑 中 与 门 的 
数量 就 是 任何 控制 线 或 次 态 线 起 作用 的 控制 步 数 的 总 和 。 与 门 总 数 的 上 界 就 是 为 该 设计 所 确 
定 的 总 控制 步 数 。 假 设 最 多 一 个 数据 通路 状态 线 影响 一 个 次 态 线 , 则 与 门 输入 端 数 就 近似 为 
bitwidth (SR) +1, 即 多 于 状态 寄存 器 的 位 宽 。 


此 外 ,需要 bitwidth (SR ) 个 单个 位 的 驱动 器 ,用 来 对 状态 寄存 器 的 每 个 位 的 非 反 相 线 进 


行 驱动 ,如 图 7-20 所 示 。 
在 确定 了 或 门 .与 门 .驱动 器 及 状态 寄存 器 的 大 小 和 数量 之 后 ,我们 就 可 以 计算 控制 单元 
中 晶体 管 的 总 数 tr (CL). By 表示 晶体 管 的 面积 系数 ,单位 是 um /人 晶体管。 系数 y 可 对 于 
给 定 的 标准 单元 库 ,并 采用 布局 布线 工具 ,通过 实验 的 方法 来 确定 。 控 制 逻辑 的 总 面积 近似 计 
算 如 下 : 
area (CL)=YX itr(CL) (7-25) 
以 上 方程 并 未 考虑 逻辑 最 小 化 和 技术 映射 的 影响 。 对 于 特定 的 逻辑 库 , 对 逻辑 优化 进行 
评估 仍 是 一 个 尚未 解决 的 问题 。 
控制 单元 的 ROM 实现 如 图 7-21 所 示 。 
对 于 一 个 W x B 的 ROM, W 表示 ROM 中 


字 的 数量 ,B 表示 每 个 字 中 的 位 数 。 控制 线 
对 于 设计 中 的 每 个 控制 步 ,在 ROM 中 Cc 
都 会 存在 一 个 字 与 之 对 应 。 这 样 ,ROM PF 
的 总 数 W 就 等 于 为 行为 所 确定 的 控制 步 数 。 
次 态 线 


对 于 每 条 控制 线 和 次 态 线 ,ROM 中 的 每 个 字 
都 包含 一 个 位 。 因 此 ,ROM 的 位 宽 B, 就 是 
控制 单元 所 产生 的 控制 线 和 次 态 线 的 总 数 。 
控制 单元 的 面积 可 以 计算 为 状态 寄存 器 
SR 的 面积 与 W XB 的 ROM 的 面积 之 和 。 





图 7.21 控制 单元 的 ROM 实现 
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7.3.7 引 脚 评估 
一 个 给 定 的 行为 常常 对 该 行为 外 的 数据 进行 访问 。 这 种 通信 将 用 一 些 连接 该 行为 与 被 


”访问 数据 的 连 线 来 实现 。 如 果 每 个 行为 都 被 综合 到 一 个 独立 的 芯片 中 ,那么 这 些 连 线 将 成 为 


芯片 边界 的 引 脚 。 

通信 宽度 (communication width) 或 在 行为 边界 用 于 访问 外 部 数据 的 连 线 数 ,取决 于 在 功 
能 描述 中 如 何 规定 通信 : 

1) 端口 声明 ;端口 的 通信 宽度 要 从 行为 中 的 端 日 声明 来 评估 。 例 如 ,假定 一 个 整数 在 设 
计 中 用 16 位 的 数 来 实现 ,那么 以 下 的 端口 声明 将 导致 在 行为 的 边界 ,REQ 被 评估 为 1 位 端 
口 ,ADDR 被 评估 为 16 位 宽 的 端口 ,DATA 被 评估 为 22 位 宽 的 端口 。 


port REQ : in bit; 

port ADDR ; out integer; 

port DATA : in bit _ vector(21 downto 0); . 

2) 通信 通道 :通信 通常 抽象 为 一 个 进行 数据 传输 的 通道 。 通 道 可 用 硬件 描述 语言 
(HDL), ,如 HardwareC[KD88,DK88] .CSP(Communicating Sequential Processes) Ñ fA h F HFE 
[Hoa78j 以 及 SpecCharts[ NVG91a] 来 定义 。 通道 将 被 综合 到 一 个 总 线 ,该 总 线 包 含 一 组 连 线 
以 及 定义 在 这 些 连 线 上 的 数据 传输 操作 协议 。 通 信和 宽度 是 所 有 对 总 线 有 贡献 的 数据 线 和 控制 
线 的 总 和 。 例 如 ,如 果 一 个 传输 整数 数据 的 通道 用 握手 协议 来 实现 , 则 需要 18 位 来 实现 该 通 
信 (16 位 用 来 实现 数据 传输 ,2 位 控制 信号 用 来 实现 握手 协议 )。 

3) 全 局 数据 :通常 系统 描述 中 的 行为 需要 访问 变量 ,这 些 变量 对 其 来 说 是 可 见 的 但 却 是 
外 部 的 。 例 如 ,一 个 VHDL 进程 可 能 要 通过 访问 全 局 信号 来 与 另 一 个 进程 进行 通信 。 对 全 局 
数据 的 访问 在 行为 边界 定义 了 隐 含 的 端口 。 与 明确 声明 端口 的 情况 一 样 , 通 信 宽 度 则 取决 于 


”全 局 数据 声明 的 类 型 。 : 


4) 过 程 调用 :对 行为 要 调用 的 过 程 的 实现 决定 了 过 程 与 行为 之 间 的 通信 和 宽度。 如 果 在 综 
合 过 程 中 过 程 是 内 肉 的 ,那么 就 不 存在 外 部 通信 ,也 就 没有 必要 在 行为 边界 设置 额外 的 引 脚 
了 。 但 是 ,如 果 该 过 程 由 一 个 独立 的 系统 组 件 实现 ,那么 所 需 的 通信 宽度 就 等 于 每 个 该 过 程 参 
数 (由 参数 声明 类 型 来 确定 ) 所 需 通信 宽度 的 总 和 。 此 外 ,还 需要 握手 信号 以 允许 主 行为 适时 
地 开始 或 结束 该 过 程 。 

对 于 给 定 的 行为 B, 设 已 表示 端口 声明 集合 , C 表示 通信 通道 集合 , V 表示 被 访问 的 全 局 
变量 集合 , S 表示 被 行为 调用 的 过 程 集 合 。 如 采 width (x ) 表 示 访 问 目 标 x 所 需要 的 连 线 数 
量 , 那 么 行为 边界 处 所 需要 的 总 互联 线 如 下 决定 : 

pins(B) = >) width ( p;) + Ds width (c;) + 2, width (v;) + Ds width (s;) (7-26) 


7.4 软件 评估 
在 7.2.2 节 中 介绍 了 软件 质量 度量 。 在 介绍 针对 程序 大 小 \ 数 据 存储 大 小 和 执行 时 间 的 
评估 方法 之 前 ,我 们 先 来 简要 地 讨论 一 下 软件 评估 的 基本 模型 。 


7.4.1 软件 评估 模型 
对 于 一 个 软件 实现 ,行为 描述 必须 编译 成 目标 处 理 器 的 指令 集 。 假 设 行为 中 的 变量 被 映 
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射 到 与 处 理 器 关联 的 存储 器 中 。 因 此 ,所 有 对 行为 中 变量 的 访问 都 假设 对 存储 器 的 读 / 写 操 作 


实现 。 功 能 描述 中 的 并 发 行为 可 在 一 个 或 多 个 处 理 器 上 实现 。 在 用 单个 处 理 右 实现 的 情况 
下 ,并 发 行为 必须 交错 执行 ,以 满足 数据 依赖 或 者 时 延 限制 。 映 射 到 同一 个 处 理 器 上 的 两 个 或 
多 个 行为 之 间 的 通信 和 是 通过 共享 存储 器 地 址 来 实现 的 。 如 果 两 个 行为 映射 到 两 个 不 同 的 处 理 
器 上 ,它们 既 可 通过 共享 存储 器 来 通信 ,也 可 通过 物理 连接 点 直接 通信 。 

软件 评估 可 采用 两 种 模型 一 一 专用 处 理 器 模型 和 通用 模型 。 下 面 将 分 别 介绍 这 两 种 模型 。 

1. 专用 处 理 器 评估 模型 

如 图 7-22a 所 示 ,在 专用 处 理 器 评估 模型 下 ,度量 的 准确 值 是 通过 采用 处 理 器 专用 的 编译 
器 将 每 种 行为 编译 到 预期 处 理 器 的 指令 集中 来 计算 的 。 根 据 与 每 个 处 理 右 关联 的 时 延 (tim- 
ing) 信 息 ( 例 如 执行 每 条 指令 所 需要 的 时 钟 周期 数 ) 和 大 小 (size) 信 息 ( 如 每 条 指令 所 需 的 字 市 
数 ) ,我 们 可 以 确定 被 编译 行为 的 大 小 和 执行 时 间 。 例 如 ,如 果 一 个 行为 必须 在 Intel 8086 微 
处 理 器 上 实现 ,首先 要 将 它 编 译 成 8086 指令 集 。 获 得 已 编译 的 行为 后 ,就 能 用 与 8086 指令 集 
相关 联 的 时 延 和 大 小 信息 来 确定 该 软件 执行 的 性 能 和 大 小 。 类 似 地 , 如果 该 行为 要 在 Mo- 
torola 68000 处 理 器 上 实现 ,就 需要 将 其 编译 到 68000 指令 集 。 基 于 68000 指令 的 时 延 和 大 小 
信息 ,评估 器 就 能 获得 该 行为 的 软件 度量 。 由 于 这 种 评估 器 是 以 某 种 专用 处 理 器 为 目标 , 故 称 
之 为 专用 处 理 器 模型 。 





时 延 
IME 
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b) 通用 评估 模型 
图 7-22 软件 评估 的 方法 
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专用 处 理 器 模型 的 主要 优点 是 获得 的 估计 值 很 准确 ,因为 行为 是 实际 地 编译 到 选 定 执行 
的 处 理 器 上 的 。 但 是 ,这 种 估量 方法 需要 针对 每 种 专用 处 理 器 的 专用 编译 器 。 因 此 ,已 有 的 评 
估 器 很 难 适应 一 种 新 的 处 理 器 。 此 外 ,以 评估 为 目的 而 编译 一 个 行为 需要 很 大 的 计算 量 。 

2. 通用 评估 模型 

专用 处 理 器 模型 根据 不 同 的 目标 处 理 器 而 使 用 不 同 的 编译 器 和 评估 器 ,与 此 不 同 ,在 
[GGN94] 中 提出 了 一 种 通用 评估 模型 。 如 图 7-22b 所 示 ,在 这 种 评估 模型 下 ,行为 首先 被 编译 
成 一 组 通用 三 地 址 指令 。 在 这 里 可 以 使 用 专用 处 理 器 的 技术 文件 ,包含 时 钟 周期 数 和 每 种 通 


”用 指令 所 需 字 节 数 等 信息 。 评 估 器 根据 通用 指令 和 目标 处 理 器 的 技术 文件 计算 出 软件 度量 。 


通用 指令 集 包 含 如 下 五 类 : 

1) BARAPB/KARIBS : <des<srci op src2>; 

2) 移动 / 装 人 /存储 指令 :< des<srce>; 

3) 条 件 转移 指令 :<if cond goto label >; 

4) 非 条 件 转移 指令 :< goto label e>; 

5) 过 程 调用 指令 :< call label >; 

在 以 上 的 指令 中 ,des 表示 一 个 寄存 器 或 一 个 存储 单元 ,而 src 和 cond 表示 常量 .寄存 郁 
或 者 存储 器 地 址 。/apel 项 表示 过 程 名 或 者 指令 标号 。 除 了 以 上 这 些 指令 ,通用 三 地 址 指令 集 
还 包括 return Fl null 指令。 

每 个 目标 处 理 器 的 技术 文件 可 以 由 处 理 器 指令 集 的 时 延 和 大 小 信息 中 产生 出 来 。 图 7- 
23 显示 出 < dmem3<-dmem 1+ dmem2 这 型 的 通用 指令 所 需 时 钟 周期 数 的 计算 过 程 。 这 里 的 
dmem 指出 是 一 种 直接 存储 器 寻 址 模式 。 通 用 指令 首先 映射 成 目标 处 理 器 的 指令 序列 。 该 通 
用 指令 所 需要 的 总 时 钟 周期 数 是 该 指令 序列 中 每 条 单独 指令 的 时 钟 周 期 数 之 和 。 图 7-23 中 
的 EA1 和 EA2 表示 在 位 移 寻 址 模式 下 计算 有 效 地 址 所 需 时 间 ,在 8086 和 68020 MOH as LE, 
这 两 个 数 分 别 是 6 和 8 个 时 钟 周期 。 这 样 ,通用 指令 在 8086 和 68020 处 理 器 上 的 运行 实行 时 
间 分 别 是 35 和 22 个 时 钟 周 期 。 

通用 指令 


dmem3=dmemi+dmem2 











808648 > 6802048 > 











指令 时 钟 
mov a6@(offseti),do (7) 
add a6@(offset2), do (2+EA2) 2 
mov do, a6@(offset3) (5) 2 






指 时 钟 
mov ax, word ptr[bp+offsetl] (10) 
add ax, word ptr[bp+offset2] (9+EA1) 4 
mov word ptr[bp+toffset3], ax (10) 3 







6802058 A 3 FF 


Lee A 6 
dmem3=dmem1+dmem2| 35H? nat dmem3=dmem1!+dmem2] 22 时 钟 


图 7-23 为 通用 指令 获得 技术 文件 


8086 技 术 文 件 
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采用 类 似 的 方法 ,我 们 对 于 每 种 类 型 的 通用 指令 ,都 可 以 得 到 其 编译 到 8086 或 者 68020 
处 理 器 上 时 所 需要 的 字 节 数 。 例 如 ,图 7-23 中 给 出 的 通用 指令 可 编译 成 三 条 8086 指令 组 成 
的 序列 。 三 条 指令 的 总 大 小 为 10 字 节 ,这 个 数 可 作为 通用 指令 大 小 的 参考 值 写 人 8086 处 理 
器 的 技术 文件 中 。 

与 专用 处 理 器 模型 相 比 ,通用 评估 模型 有 若干 优点 。 首 先 , 通 用 模型 不 要 求 为 不 同 目标 处 
理 器 准备 不 同 的 编译 器 和 评估 器 。 软 件 评估 要 的 只 是 一 个 编译 器 一 个 评估 器 及 一 组 技术 文 
件 。 其 次 ,通用 模型 使 得 将 评估 器 重 定向 到 新 的 处 理 器 变 得 很 容易 。 重 定向 的 工作 包括 提供 
面向 新 的 处 理 器 的 技术 文件 。 在 专用 处 理 器 模型 中 , 则 新 的 处 理 器 除了 需要 处 理 器 指令 集 的 
时 延 和 大 小 信息 之 外 ,还 需要 一 个 编译 器 。 最 后 ,每 种 类 型 处 理 器 的 特点 都 会 在 该 处 理 器 的 技 
术 文 件 中 体现 出 来 。 通 用 三 地 址 指令 摆脱 了 指令 的 特异 性 。 因 此 ,将 行为 编译 成 通用 指令 要 
比 编译 成 作为 处 理 融 指令 集 一 部 分 的 复杂 指令 来 得 更 简单 更 快速 。 通 用 模型 的 一 个 缺点 是 评 
估 时 准确 率 较 低 ,这 在 很 大 程度 上 是 因为 通用 指令 集 代 表 的 仅仅 是 处 理 器 集 全 部 指令 的 一 小 
部 分 。 一 组 真正 的 处 理 器 指令 , 比 起 与 之 等 价 的 一 组 通用 指令 ,应 该 能 够 更 有 效 地 实现 规定 的 
操作 。 

我 们 将 采用 通用 评估 模型 来 讨论 软件 实现 中 对 程序 存储 器 大 小 .数据 存储 器 大 小 及 软件 
性 能 的 评估 技术 。 同 样 的 技术 也 可 应 用 于 专用 处 理 器 评估 模型 。 


7.4.2 程序 执行 时 间 | 

一 个 行为 的 软件 或 程序 的 执行 时 间 可 采用 动态 模拟 和 静态 评估 两 种 方法 之 一 来 确定 。 给 
定 一 组 输入 数据 ,动态 模拟 执行 程序 并 记录 每 次 执行 所 需要 的 时 钟 周期 数 。 给 定 不 同 组 的 输 
人 数据 ,由 于 存在 着 与 数据 相关 的 条 件 分 支 和 循环 ,动态 模拟 就 会 得 到 不 同 的 时 钟 周期 数 。 另 
一 方面 ,静态 评估 对 输入 数据 不 敏感 ,而 且 , 关 循环 迭代 的 次 数 已 知 并 且 条 件 分 支 的 概率 能 准 
确 预测 ,静态 评估 就 能 得 出 相当 准确 的 结果 。 此 外 ,静态 评估 比 动态 模拟 更 快 , 且 和 需要 的 空间 
更 小 。 在 这 个 部 分 ,我 们 将 描述 一 种 静态 评估 技术 及 其 在 软件 性 能 评估 方面 的 应 用 。 

软件 性 能 评估 与 7.3.4 节 中 介绍 的 评估 硬件 执行 时 间 类 似 。 首 先 ,将 功能 描述 分 成 几 个 
基本 的 块 。 在 每 个 基本 块 中 ,语句 集合 被 编译 成 通用 三 地 址 指令 集合 。 每 个 基本 块 b, 的 执行 
时 间 exectime (5b;) 可 由 在 这 个 基本 块 内 的 每 条 通用 指令 的 执行 时 间 ( 目 标 处 理 器 的 技术 文件 
中 给 出 的 该 通用 指令 的 时 钟 周期 数 ) 之 和 来 决定 。 

接着 ,给 定 行为 的 基本 块 结构 被 映射 到 一 个 等 价 的 控制 流 图 G 上 。G 上 的 每 个 结 点 有 一 
个 权 值 ,该 值 与 相应 基本 块 的 软件 执行 时 间 相 等 。 通 过 应 用 基于 概率 的 流 分 析 技 术 ,我 们 可 以 
得 到 基本 块 在 行为 中 的 执行 频率 。 最 后 ,可 采用 方程 7-14 所 示 的 方法 来 获得 整个 行为 在 平均 
情况 下 的 软件 执行 时 间 。 

一 般 情况 下 ,编译 器 通过 寄存 器 分 配 .循环 优化 和 全 局 优化 等 技术 来 优化 上 且 标 代码 。 设 计 
者 可 以 通过 向 编译 器 传送 特殊 标志 位 直接 调用 这 些 优化 。 本 节 中 介绍 的 通用 评估 模型 不 使 用 
任何 优化 启发 式 方法 ,因此 软件 执行 时 间 的 评估 计算 是 针对 非 优化 代码 的 。 若 要 评估 优化 代 
码 的 性 能 ,我 们 需要 知道 设计 者 用 于 产生 机 器 指令 的 编译 器 的 优化 率 。 性 能 优化 率 (perfor- 
mance-optimization ratio)6 定义 为 优化 代码 性 能 与 非 优化 代码 性 能 的 比率 。 通 过 采用 著名 的 
Livermore 循环 内 核 进 行 的 若干 次 实验 , [GGN94] 得 出 从 C 转 成 8086、80286 .68000 和 68020 
指令 集 的 优化 率 分 别 为 0.74.0.68.0.54 和 0.49。 值 得 强调 的 是 这 些 系数 取决 于 所 采用 的 数 


th 
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据 集合 。 因 此 ,性 能 评价 的 精确 度 将 取决 于 代码 和 数据 集合 与 用 于 决定 优化 率 的 代码 和 数据 
集合 的 接近 程度 。 | 

经 过 流 分 析 之 后 ,得 到 行为 B 的 性 能 评价 exectime(B), 再 乘 上 一 个 性 能 优化 率 5 ,以 考虑 
编译 器 优化 的 影响 ,也 就 是 说 ,者 设 编译 和 优化 过 的 行为 的 软件 执行 时 间 被 评估 为 
optimized _exectime(B) MWA: | 

| optimized _exectime(B) = 6 X exectime(B) (7-27) 

对 于 简单 的 处 理 器 ,以 上 的 评估 方法 能 够 很 好 地 工作 。 但 是 ,对 带 有 指令 和 数据 缓 仔 的 流 

水 线 和 并 行 处 理 器 的 执行 时 间 进 行 评估 仍然 是 一 个 尚未 解决 的 问题 。 


7.4.3 程序 存储 大 小 
程序 大 小 评估 的 第 一 步 也 涉及 将 给 定 行为 编译 成 通用 指令 。 每 种 通用 指令 的 大 小 在 目标 
处 理 器 的 技术 文件 中 做 出 了 规定 。 根 据 每 条 通用 指令 的 大 小 ,一 个 行为 的 程序 存储 大 小 可 以 
通过 求 该 行为 中 的 每 条 通用 指令 大 小 之 和 来 计算 。 如 果 一 个 行为 B 被 编译 成 一 个 通用 指令 
296| ”的 集合 G, 且 instr _size(g) 表 示 通 用 指令 g 的 大 小 ,行为 了 所 需要 的 程序 大 小 可 用 下 式 计 
算 : 
progsize(B) = > instr _size(g) | (7-28) 


gEG 
如 同 7.4.2 节 中 介绍 的 方法 ,考虑 到 编译 优化 的 影响 ,还 可 以 计算 出 平均 优化 率 9。 从 7- 
28 式 中 得 到 的 程序 大 小 ,可 以 乘 9 从 而 得 出 对 于 已 编译 和 优化 行为 的 更 准确 评 信 。 


7.4.4 数据 存储 大 小 - 

通过 检查 功能 描述 中 的 数据 声明 可 以 得 到 数据 存储 的 大 小 。 数 据 声 明 d 的 数据 存储 大 
小 datasize (qd ) 由 d 的 基 类 型 大 小 和 d 中 所 包含 的 元 素 个 数 决 定 。 任 何 数据 声明 的 基 类 型 都 
是 在 语言 定义 中 不 可 再 分 的 类 型 。 例 如 ,考虑 以 下 这 个 声明 : 

variable X : bit; 

variable Y ; array ( 9 downto 0, 15 downto 0 ) of integer; 


变量 X 的 基 类 型 是 位 , 且 它 的 基 类 型 元 素 的 个 数 是 1; 变 量 Y 的 基 类 型 是 整数 , 且 它 的 基 
类 型 元 素 的 个 数 是 160。 

描述 中 提供 了 每 个 不 同 基 类 型 的 数据 项 
在 软件 实现 中 所 需 的 大 小 ,这 些 都 定义 在 一 个 
查找 表 中 。 图 7-24 显示 出 一 些 VHDL 语言 中 
定义 的 基 类 型 对 应 的 数据 存储 大 小 。 对 于 声 
BA d ,datasize (qa ) 可 以 通过 将 d 的 基 类 型 大 
小 乘 以 中 的 基 类 型 元 素 的 数量 来 计算 。 例 
如 ,上 面 的 声明 Y, 基 类 型 是 整 型 ,从 图 7-24 
的 查找 表 中 可 以 查 出 , 整 型 需要 四 个 字 节 的 存 
储 空 间 。 由 于 变量 Y 有 160 个 元 素 , 所 以 声明 Y 的 总 存储 大 小 为 640 FH. 

在 得 到 每 个 声明 的 数据 存储 大 小 之 后 ,行为 B 的 数据 存储 大 小 就 可 以 通过 将 它 包 含 的 每 
个 声明 的 数据 存储 大 小 相 加 来 求 得 。 设 D 表示 行为 B 中 声明 的 集合 , 则 行为 B 的 数据 存储 

大 小 可 用 以 下 方法 求 得 : | 








整数 ,自然 数 , 正 数 
实数 






图 7-24 一些 VHDL 基 类 型 的 数据 大 小 
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datasize(B) = > )datasize(d) | (7-29) 
d€D l 
假定 所 有 变量 生存 期 都 和 行为 的 执行 时 间 相 等 ,也 就 是 说 两 个 变量 不 需要 共享 存储 器 地 
址 。 在 这 个 前 提 之 下 ,上 面 介绍 的 对 数据 存储 大 小 的 评估 方法 是 准确 的 。 如 果 一 个 行为 含有 
大 量 短 生 存 期 的 变量 , 则 数据 存储 大 小 的 评估 就 必须 结合 进 生 存 期 分 析 ,以 覆盖 那些 没有 生存 
期 重音 的 变量 。 


7.5 系统 级 工具 的 评估 技术 


在 这 节 中 ,我 们 将 对 在 一 些 高 层次 综合 和 系统 设计 工具 中 使 用 的 质量 度量 和 评估 方 法 进 
行 综述 。 


7.5.1 BUD 

BUD( 自 底 向 上 设计 ,Bottom Up Design) [MK90] 是 作为 高 层次 综合 系统 的 一 部 分 ,进行 
全 局 分 析 和 调度 的 系统 。 如 6.5.2 WAE, BUD 采用 分 级 结 群 算法 将 单一 行为 的 操作 划分 成 
群 , 并 利用 详细 的 物理 信息 来 估算 每 个 群 的 面积 和 性 能 ,进而 对 整个 设计 进行 估算 。 

BUD 的 输入 是 行为 的 值 追 踪 (Value trace, VT)LEST78] 表 示 。 此 外 ,还 提供 一 个 行为 的 

追踪 文件 ,包含 模拟 过 程 中 每 个 操作 执行 的 次 数 。 当 确定 平均 循环 时 间 时 ,我 们 可 以 从 追 踩 文 
件 中 得 到 行为 中 操作 执行 的 概率 。BUD 还 可 以 访问 包含 有 详细 信息 的 单元 数据 库 ,这 些 信息 
包括 单元 功能 .时 延 . 长 度 .宽度 及 功率 耗 散 。BUD 评估 器 的 输出 是 实现 行为 所 需 的 面积 和 执 
行 时 间 。 
”给 定 含 有 一 组 操作 的 群集 合 , 首 先 评估 每 个 群 的 面积 。 群 中 的 每 一 类 操作 都 分 配 到 一 个 
单独 的 功能 单元 。 时 钟 周期 的 初 值 由 系统 设计 者 指定 。 各 种 操作 通过 列表 调度 器 分 配给 各 个 
控制 步 。 采 用 生存 期 分 析 来 确定 每 个 群 中 寄存 器 的 数量 和 大 小 。 多 路 选择 器 是 基于 群 中 端口 
数 的 多 少 分 配给 群 。 群 的 宽度 和 长 度 是 由 单元 的 宽度 和 长 度 决定 的 ,这 些 单元 是 选择 用 来 实 
现 寄存 器 、 功 能 单元 及 多 路 选择 器 的 。 

一 日 每 个 群 的 面积 确定 了 ,BUD 就 采用 Zimmerman[ Zim88] 提 出 的 一 种 布 图 规划 技术 来 
确定 每 个 群 的 布局 和 方位 。 首 先 ,行为 被 递归 地 划分 ,产生 了 对 设计 的 一 种 树 表 示 。 树 的 叶 结 
点 是 设计 中 单独 的 群 。 然 后 ,从 叶 结 点 到 根 结 点 对 树 的 表示 进行 遍历 ,产生 群 的 所 有 可 能 的 排 
列 方案 。 形 状 函数 用 来 表示 任何 群 组 合 的 高 度 和 宽度 的 关系 。 根 据 形状 函数 可 以 算出 在 某 个 
特定 的 高 宽 比 条 件 下 群 的 排列 方案 。 该 布 图 最 终 被 调整 以 适应 连接 群 间 的 布线 区 域 。 

数据 通路 确定 下 来 以 后 ,要 重新 计算 时 钟 周期 cl ,方法 是 求 在 任何 一 个 控制 步 内 信和 号 通 
过 数据 通路 的 最 大 时 延 。 根 据 为 VT 提供 的 追踪 文件 ,可 以 确定 控制 步 i(1 专 i) 执行 的 概 
率 p;。 这 样 就 能 确定 行为 的 平均 执行 时 间 如 下 : 


N | 
exectime(B) = clk x (>) pi) (7-30) 
i=1 


BUD 中 评估 器 的 主要 优势 是 在 评估 过 程 中 结合 进 了 详细 的 物理 设计 信息 。 例 如 ,执行 了 
布 图 规划 ,确定 了 布线 区 域 , 以 及 在 计算 时 钟 周期 的 过 程 中 考虑 到 了 布线 时 延 等 。 因 此 ,对 时 
延 和 面积 的 评估 可 以 认为 是 精确 的 。 然 而 ,BUD 中 进行 详细 评估 导致 的 结果 是 计算 评 佑 结 采 
所 需 的 时 间 可 能 很 长 。 例 如 ,就 布 图 规划 步骤 本 身 而 言 ,[MK90] 公 布 了 一 个 秒 数量 级 的 执行 
时 间 。 随 着 系统 规模 的 增加 ,在 BUD 中 进行 设计 空间 探索 将 会 耗费 很 大 的 计算 量 。 另 外 ， 


ho 
\O 
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BUD 不 估算 控制 单元 面积 ,而 这 些 控制 单元 面积 在 某 些 设计 中 很 可 能 是 整个 面积 的 重要 组 成 


部 分 。 


7.5.2 Aparty 

Aparty[LT91，Lag89，LT89j 是 一 个 结构 划分 器 , 它 将 一 个 系统 的 行为 划分 成 多 个 部 分 ， 
每 个 部 分 可 能 表示 一 个 芯片 或 者 芯片 上 的 一 个 块 。 给 定 一 个 行为 的 VT 表示 ,Aparty 利用 一 
个 多 级 结 群 技 术 来 产生 对 行为 的 划分 。 | 

Aparty 中 评估 器 的 输入 是 一 个 结 群 的 集合 。 每 个 群 包含 该 行为 的 奉 干 个 操作 。 评 佑 器 
还 需要 访问 一 个 面积 文件 ,该 文件 包含 实现 每 个 操作 所 需要 的 每 个 位 的 面积 。 

Aparty 通过 计算 每 个 群 中 所 有 功能 单元 和 多 路 选择 器 的 面积 之 和 来 得 到 该 群 的 面积 。 
对 于 每 个 群 , 群 中 每 种 类 型 的 操作 都 会 分 配 到 一 个 功能 单元 。 如 果 给 定 类 型 不 只 有 一 个 操作 
映射 到 同一 个 群 上 ,那么 适当 的 多 路 选择 器 就 会 被 分 配给 这 些 功 能 单元 以 实现 这 些 操 作 。 

Aparty 对 每 个 群 边界 互联 ( 连 线 的 数量 ) 的 评估 方法 是 计算 该 群 与 其 他 群 之 间 连 接 的 大 
小 之 和 。 

评估 性 能 是 通过 采用 CSTEP 调度 器 [ Nes87] 对 功能 描述 进行 调度 而 产生 的 控制 步 数 。 

Aparty 的 评估 体现 的 是 速度 和 准确 度 的 平衡 。 通 过 采用 一 个 只 包含 功能 单元 和 多 路 选 


” 择 器 的 简单 模型 ,可 获得 对 群 面积 的 快速 评估 。 因 此 ,设计 者 就 能 探索 更 大 的 设计 空间 。 但 同 


时 ,评估 还 是 相当 粗糙 的 ,因为 寄存 器 .互联 和 控制 单元 面积 都 没有 考虑 进来 。 


7.5.3 Vulcan 

Vulcan [GD90] 划 分 工具 将 行为 描述 成 一 种 图 ,这 种 图 包含 两 种 边 ,依赖 边 和 排 矿 边 。 顶 
点 表示 该 行为 中 的 操作 。 依 赖 边 表示 操作 间 的 依赖 关系 ,而 排斥 边 表示 相应 操作 的 排他 性 ,这 
意味 着 在 实现 中 这 些 操作 可 以 共享 相同 的 功能 单元 。 每 个 顶点 都 带 有 相应 操作 所 需 的 面积 和 
表示 传播 时 延 的 时 延 ( 用 时 钟 周 期 数 表示 )。 时 钟 周 期 被 规定 为 Vulcan 的 一 个 输入 。 

图 的 面积 估计 可 以 简单 地 计算 为 该 图 中 所 有 顶点 面积 代价 之 和 。 然 而 ,由 排斥 边 连接 的 
顶点 集合 代表 的 是 可 以 共享 硬件 的 操作 ,所 以 在 面积 评估 中 只 计 和 人 一 个 顶点 。 

图 的 性 能 可 以 通过 计算 图 中 从 起 点 到 终点 的 最 长 路 径 的 长 度 来 得 到 。 也 就 是 说 ,将 最 长 
路 径 上 每 个 顶点 的 时 延 累加 起 来 。 如 果 一 条 边 所 连接 的 两 个 顶点 被 分 配 到 不 同 的 划分 部 分 
中 ,那么 这 条 边 上 带 有 一 个 单位 时 延 ,以 反映 引信 的 通信 代价 。 

Vulcan 中 评估 器 的 优点 是 它 能 够 提供 快速 的 评估 , 因为 面积 和 性 能 的 评估 都 是 通过 对 图 
中 顶点 所 带 的 代价 和 时 延 简 单 求 和 得 到 的 。 面 积 评估 的 准确 度 可 能 比较 低 , 因 为 布线 .寄存 器 
面积 以 及 顶点 对 功能 单元 的 共享 等 情况 都 被 忽略 了 。 


7.5.4 SpecSyn 


SpecSyn[ GVN94] 是 一 个 为 设计 者 提供 设计 工具 将 系统 描述 划分 成 一 组 系统 组 件 的 系统 
设计 框架 。 产 生 的 系统 组 件 表示 芯片 .内 存 、 处 理 器 上 执行 的 软件 或 者 总 线 。 

SpecSyn 的 输入 是 该 系统 可 执行 的 系统 描述 。 VHDLI IEE88 | Al SpecCharts[ NVG91a 8 
言 可 用 于 该 目的 。 要 评估 诸如 行为 执行 时 间 、 时 钟 周 期 及 面积 等 硬件 参数 ,该 工具 提供 了 设计 
库 (包含 数量 、 类 型 .时 延 、 面 积 及 RT 组 件 等 用 于 实现 设计 的 信息 )。 要 评估 诸如 程序 的 执行 
时 间 和 大 小 等 软件 度量 ,该 工具 提供 了 类 似 于 7.4.1 节 所 描述 的 处 理 器 技术 文件 (包含 指令 大 
小 和 在 目标 处 理 器 上 的 执行 时 间 等 信息 )。 
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时 钟 周 期 评 佑 船 采 用 7.3.2 市 提出 的 松弛 最 小 化 方法 选择 时 钟 周期 。SpecSyn 还 允许 设 
计 者 明确 地 指定 时 钟 周 期 。 

SpecSyn 中 的 面积 评估 允许 设计 者 指派 功能 单元 以 实现 某 个 行为 。 如 果 没 有 指派 功能 单 
元 ,就 假设 进行 对 每 种 功能 单元 的 最 少 指派 。 控 制 步 数 的 评估 采用 的 是 7.3.3 节 中 描述 的 “ 操 
VERE — 使用" 方法。 寄存 器 的 评估 则 采用 生存 期 分 析 。 由 于 评估 器 没有 实际 地 将 操作 调度 到 
控制 步 中 ,变量 的 生存 期 就 以 语句 级 的 粒度 来 定义 , 即 用 语句 数量 来 确定 变量 的 定义 和 使 用 。 
这 个 方法 不 需要 建立 数据 流 图 并 且 相 对 而 言 要 快 得 多 。 接 下 来 ,要 评估 的 是 寄存 器 和 功能 单 
元 所 需 多 路 选择 器 的 数量 和 大 小 。 鉴 于 对 控制 逻辑 面积 的 评估 采用 类 似 于 7.3.6 节 介 绍 的 技 
AR , 故 假 设 控制 单元 用 一 个 状态 寄存 器 和 一 个 二 级 与 或 门 网 络 来 实现 。 | 

给 定 一 个 用 VHDL BB Ti RYT A, SpecSyn 性 能 评估 器 首先 确定 每 个 基本 块 所 需 
要 的 控制 步 数 ,可 采用 7.3.3 节 介 绍 的 操作 符 - 使 用 方法 。 使 用 基于 概率 的 流 分 析 方 法 将 对 
每 个 基本 块 的 评估 综合 起 来 从 而 获得 行为 的 执行 时 间 。 

如 果 采 用 SpecCharts 语言 来 描述 一 个 层次 化 的 行为 ,那么 SpecSyn 中 的 性 能 评估 以 一 种 
至 底 向 上 的 方式 进行 。 每 个 叶 行为 的 执行 时 间 以 与 前 面 介绍 的 针对 VHDL 顺序 语句 相 类 似 
的 方式 来 确定 。 对 于 任何 层次 级 别 上 的 任何 行为 ,该 行为 执行 时 间 的 评估 可 通过 将 其 子 行为 
的 评估 结果 结合 起 来 的 方法 来 确定 。 如 果 一 个 行为 包含 有 并 发 的 子 行为 , 则 该 行为 的 执行 时 
间 是 为 它 的 那些 子 行为 的 执行 时 间 所 做 评估 的 最 大 值 。 

SpecSyn 为 设计 者 提供 了 评估 器 ,用 于 评 佑 引 黎 和 行为 对 变量 过程. 通信 通道 的 访问 次 
数 。 这 些 可 由 设计 者 用 来 决定 将 系统 描述 中 的 对 象 分 配 到 不 同 的 系统 组 件 。 

对 于 软件 实现 ,SpecSyn 提供 了 对 执行 时 间 、 程 序 大 小 和 数据 大 小 [GGN94j] 的 评估 器 。 平 
均 和 最 坏 情 况 下 对 软件 执行 时 间 报 告 的 错误 分 别 是 8% 和 19% 。 在 程序 存储 大 小 评 佑 方面， 
则 平均 和 最 坏 情况 下 的 错误 分 别 是 5% 和 8%。 

任何 一 个 系统 设计 决策 通常 只 对 设计 做 一 个 或 一 些 改变 。 一 个 这 种 决策 的 例子 是 在 系统 
划分 中 将 一 个 变量 从 一 个 系统 组 件 重新 放置 到 另 一 个 系统 组 件 中 。 如 果 在 每 个 设计 决策 之 后 
都 要 根据 系统 描述 重新 进行 度量 评估 ,将 是 很 浪费 时 间 的 事情 ,尤其 是 考虑 到 对 设计 本 身 只 做 
了 增 量 式 的 改变 。 为 了 避免 这 种 重复 评估 ,SpecSyn 评估 器 考虑 设计 的 任何 变化 ,以 允许 对 评 
估 进 行 增 量 式 修 改 的 方式 来 保留 设计 信息 。 给 定 系统 的 可 执行 描述 ,评估 器 首先 经 历 一 个 建 
立 的 阶段 ,在 这 个 阶段 中 将 产生 包含 相关 设计 信息 的 详细 内 部 结构 。 对 于 任何 后 继 的 设计 决 
策 ,通过 更 新 内 部 结构 反映 设计 决策 并 重新 计算 评估 ,就 可 以 在 一 个 恒定 的 时 间 内 获得 评 佑 。 
SpecSyn 支持 对 于 执行 时 间 、 硬 件 面积 . 引 脚 以 及 软件 大 小 的 增 量 式 评 佑 更 新 。 这 种 方法 的 主 
要 优点 是 通过 减少 获得 评估 所 需要 的 时 间 ,使 得 那些 可 能 要 计算 数 千 个 划分 的 复杂 划分 算法 
得 以 运用 。 

SpecSyn 评估 器 的 主要 优点 在 向 划分 器 提供 评估 的 速度 方面 。SpecSyn 使 用 设计 中 各 个 
方面 的 近似 值 ,例如 ,在 没有 做 任何 布 图 规划 的 情况 下 将 设计 面积 评估 为 晶体 管 数 量 的 晒 数 ， 
或 者 在 没有 将 操作 绑 定 到 特定 的 功能 单元 上 的 情况 下 对 多 路 选择 器 进行 评估 。 因 此 ,就 使 得 
系统 划分 器 能 在 一 个 相对 较 短 的 时 间 内 能 检查 大 量 的 选择 。 但 是 ,SpecSyn 中 的 评估 器 是 依 
赖 于 描述 的 。 例 如 ,一 个 单 状态 的 功能 描述 可 能 包含 条 件 分 支 。 控 制 步 评 佑 器 将 为 测试 每 一 
个 条 件 都 分 配 一 个 控制 步 ,即使 整个 设计 可 以 在 一 个 控制 步 完 成 。 评 估 器 在 评估 控制 逻辑 面 
积 时 不 做 任何 优化 ,并 且 忽 略 了 连 线 的 时 延 。 


we 
we 
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7.6 结论 和 发 展 方 向 


在 系统 级 对 巨大 的 设计 空间 进行 探索 ,就 需要 对 质量 度量 进行 快速 地 评估 。 在 本 章 ,我 们 
定义 了 在 系统 级 与 硬件 和 软件 实现 都 有 关系 的 一 些 质 量度 量 : 时 钟 周期 控制 步 、 通 信 速 率 、 软 
件 和 硬件 执行 时 间 、 面 积 、 引 脚 以 及 程序 和 数据 存储 的 大 小 。 我 们 描述 了 用 于 评估 这 些 系统 参 
数 的 技术 。 此 外 ,我 们 还 定义 了 用 来 评 信 任何 一 种 评估 技术 的 三 项 准则 ;准确 性 、 速 度 和 保 真 
度 。 我 们 还 讨论 了 一 些 在 高 层次 综合 和 系统 设计 工具 中 采用 的 评 信和 方法 。 

设计 质量 评估 的 未 来 工作 需 着 重 于 才干 方面 ,大 体 可 分 为 三 个 广阔 的 领域 : 

(a) 优化 :评估 技术 需要 进一步 加 强 , 把 综合 和 编译 工具 产生 的 优化 影响 包括 进来 。 例 
如 ,控制 和 数据 通路 组 件 上 的 逻辑 最 小 化 可 以 在 相当 大 程度 上 减少 设计 面积 和 时 延 。 类 似 地 ， 
编译 器 也 进行 许多 优化 ,如 死 代码 的 消除 寄存 器 文件 的 优化 及 公共 于 表达 式 的 消除 。 缺 乏 考 
虑 这 些 优化 影响 的 技术 ,将 很 可 能 导致 对 设计 面积 和 软件 执行 时 间 等 类 似 质 量度 量 的 过 高 佑 
计 。 

(b) 新 的 度量 : 随 着 系统 设计 变 得 越 来 越 精确 ,需要 定义 新 的 质量 度量 以 及 相应 的 评估 技 
术 。 例 如 ,对 于 设计 特性 如 功率 耗 散 、 可 测试 性 、 软 硬件 集成 ,可 维护 性 和 可 制造 性 等 都 需要 害 
义 度量 并 且 发 展 相 应 的 评估 技术 。 

(c) 新 的 结构 特征 :评估 中 也 要 估算 更 加 复杂 的 结构 特征 带 来 的 影响 。 例 如 ,软件 评估 技 
术 就 需要 升级 ,以 将 VLIW \ 流 水 线 处 理 、 指 令 预 取 、 矢 量 处 理 及 高 速 缓存 等 结构 特征 包含 进 
来 。 硬 件 评估 技术 也 需要 增强 以 包括 如 复杂 时 钟 方案 (例如 ,多 相 时 钟 ) 等 特征 。 


7.7 练习 


1. 如 图 7-25 所 示 ,E(D) 和 M(D) 分 别 表 示 四 个 设计 实现 的 质量 度量 的 估计 值 和 实际 测量 
值 。 计 算 所 用 评估 方法 的 保 真 度 。 

2. 为 以 下 每 个 设计 特性 设计 两 个 度量 : 
(a) 功 率 耗 散 ,(b) 可 测试 性 设计 ,(c) 可 制造 性 。 

3. 考虑 图 7-7 所 示 的 硬件 设计 模型 。 根 据 控制 和 状态 位 寄存 器 中 存在 的 组 件 时 延 ( 不 考 虚 任 
何 线 网 时 延 ) , 列 出 一 个 时 钟 周期 的 公式 。 

4. 图 7-26 所 示 的 是 一 个 行为 描述 中 各 种 操作 出 现 的 次 数 。 图 中 还 给 出 了 实现 这 些 操 作 所 需 
功能 单元 的 时 延 。 使 用 最 大 操作 数 时 延 法 和 松弛 最 小 化 方法 估算 时 钟 周 期 ,并 计算 这 两 种 
估算 的 时 钟 利 用 率 。 


W 112 109 . 
Y 139 121 加 4 
Z 205 132 Fe 9 163 | 


图 7-25 ” 某 度量 的 估计 值 和 测量 值 图 7-26 ”操作 出 现 次 数 和 时 延 












5. 如 果 一 些 操作 用 流水 线 功 能 单元 实现 ,如 何 修改 “操作 符 -使 用 ”方法 以 确定 控制 步 数 ? 





设计 质量 评估 165 


应 用 “操作 符 - 使 用 "方法 计算 下 面 VHDL 语句 被 调度 所 需要 的 控制 步 数 。 假 设 时 钟 周 期 
是 2$ ns, 并 采用 一 个 乘法 器 (时 延 100 ns) 和 两 个 加 法 器 (50 ns) 实 现 这 个 设计 。 


:= B+(C*3); 
B+C+D; 
A*A; 
C+D+Y; 
A+E; 


7. 设计 两 个 优先 级 函数 ,在 应 用 列表 调度 算法 时 将 优先 级 列表 中 的 操作 进行 排序 。 使 用 这 两 
个 新 函数 ,调度 图 7-12b 中 的 行为 。 假 设 可 用 的 元 件 有 :一 个 加 法 器 、 一 个 减法 器 和 两 个 乘 
法 器 。 

8. 如 何 修改 7.3.3 节 中 介绍 的 列表 调度 算法 使 之 能 考虑 下 面 的 每 个 因素 ? 

(a) 多 周期 操作 ; 
(b) 流水 线 功 能 单元 ; 
(c) 需 要 固定 时 延 的 访问 内 存 。 

9. 对 于 一 个 要 在 带 有 cache( 高 速 缓冲 存储 器 ) 的 处 理 器 上 实现 的 行为 , 设 对 cache 每 次 访问 的 
命中 率 ( 在 cache 中 找到 所 需 数据 的 概率 ) 为 0.8。 如 果 cache 和 主 存 的 访问 时 间 分 别 是 
50ns 和 300ns, 则 该 行为 每 次 访问 内 存 所 需要 的 平均 时 间 是 多 少 ? 

“10. 假设 对 于 一 个 行为 中 的 每 个 操作 ,组 件 库 中 都 有 若干 具有 不 同时 延 和 成 本 的 功能 单元 。 

在 这 些 情况 中 ,如何 估计 功能 单元 的 数量 ? 
**11. 如 何 修 改 7.4.2 节 中 介绍 的 估算 软件 执行 时 间 的 方法 ， 使 之 能 考虑 RISC 处 理 器 中 指 
令 的 流水 线 操作 。 

**12. 给 定 一 个 行为 描述 ,该 行为 将 在 带 有 cache 的 处 理 器 上 以 软件 方式 执行 ,设计 一 种 策略 

估算 cache 的 访问 命中 率 (在 cache 中 找到 所 需 数 据 的 概率 )。 
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第 8 章 设计 描述 细 化 


在 第 2.3、4、5 章 ,我 们 介绍 了 一 些 用 于 获得 系统 功能 描述 的 方法 。 在 第 6 章 和 第 7 ER 
们 介绍 了 震 干 将 这 些 功能 划分 到 不 同 的 系统 组 件 上 的 技术 ,以 及 对 这 些 划分 结果 的 设计 质量 
进行 评 佑 的 技术 。 本 章 ,我 们 将 把 注意 力 放 在 如 何 为 我 们 选取 的 划分 结果 和 所 选 组 件 创建 一 
个 细 化 的 描述 上 。 至 此 ,我 们 将 向 着 系统 的 最 终 实 现 又 迈进 一 步 。 


8.1 引言 


一 个 系统 描述 包括 很 多 功能 对 人 象 (functional object) ,如 :行为 、 变 量 以 及 通信 通道 。 在 系 
统 设计 阶段 ,我 们 将 这 些 功能 对 象 结 群起 来 ,成 为 一 个 群 组 ,并 将 它们 描述 成 为 一 组 系统 组 件 
(system component ) , 如 : 处 理 器 (processor) 专用 集成 电路 (ASIC) . Fy 4% (memory) 和 总 线 
(bus)。 虽 然 功 能 对 象 是 没有 任何 结构 的 ,但 是 系统 组 件 拥有 很 好 的 结构 信息 ,如 ,一 个 芯片 的 
引 脚 数 ,内存 的 宇 (word) 数 和 大 小 .总线 中 的 线 (wire) 数 等 。 将 系统 描述 中 的 功能 对 象 映射 成 
为 系统 组 件 的 过 程 称 为 描述 细 化 (specification refinement), 

描述 细 化 是 系统 设计 中 一 个 重要 的 部 分 ,这 是 因为 ;首先 ， 描述 细 化 通过 更 新 系统 描述 来 
反映 系统 划分 时 所 决定 的 结 群 策 略 ,从 而 使 系统 描述 在 各 个 方面 保持 一 致 。 例 如 : 当 几 个 变量 
被 绪 群 在 一 起 ,并且 被 分 配 到 同一 个 存储 器 上 ,那么 ,对 这 些 变量 的 声明 和 引用 都 必须 被 更 新 。 
描述 细 化 工作 将 会 把 变量 声明 替换 成 为 存储 器 中 数组 的 声明 ,还 会 把 所 有 对 原 有 变量 的 引用 
更 新 为 对 数组 单元 的 访问 。 其 次 , 细 化 使 得 系统 描述 可 模拟 ,使 得 设计 者 可 以 在 系统 设计 步 又 
完成 后 对 系统 功能 的 正确 性 进行 验证 。 最 后 , 细 化 后 的 描述 可 以 在 系统 设计 之 后 作为 验证 、 综 
合 和 编译 工具 的 输入 。 

本 章 中 ,我 们 将 介绍 一 系列 描述 细 化 的 工作 。 首 先 ,我 们 将 介绍 与 变量 和 通道 组 的 具体 实 
现 相 关 的 细 化 工作 。 其 次 ,我 们 介绍 一 些 机 制 ,用 于 解决 由 多 个 行为 并 发 访问 共享 资源 所 导致 
的 冲突 ,如 多 个 变量 被 结 群 到 同一 个 存储 器 或 者 多 个 通道 被 结 群 到 同一 个 总 线 。 再 次 ,我 们 讨 
论 将 行为 分 配 到 有 固定 接口 ( 引 脚 结构 和 通信 协议 ) 的 标准 组 件 时 可 能 产生 的 影响 ,并 介绍 将 
两 个 接口 不 兼容 的 标准 组 件 连接 在 一 起 的 方法 。 最 后 ,我 们 讨论 已 经 分 配 到 硬件 和 软件 组 件 
上 的 行为 之 间 的 通信 实现 的 相关 内 容 。 


8.2 细 化 变量 群 组 


如 有 果 一 组 变量 被 映射 到 一 块 存储 器 ,这 块 存储 器 在 细 化 描述 中 的 模型 就 将 是 一 个 有 相应 
大 小 和 位 宽 的 数组 。 变 量 群 组 (variable grouping) 描 述 的 细 化 工作 包括 两 部 分 : SER GB Ae 
fii ar MUL FER 
8.2.1 eink 

RRM ATE— AEEA Bl — ER BCS) A EB word) CA i BE A FF KI, BR 
Pr AY EY AA AS AC) Ea) ET RE SS A EE P eB aE 
中 每 个 字 (word) 的 位 (bit) 上 。 
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168 F 8Ë 


8 位 存储 器 


“4 A(3 downto 0) 
B(7 downto 0) 
B(15 downto8) 
C(7 downto 0) 
C(11 downto8) 
D(5 downto 0) 

D(11 downto6) 





b) 上 述 变 量 到 一 个 8 位 宽 
的 存储 区 域 的 映射 





7..4 3..0 
a i 至 存储 器 中 的 变量 D 
c) 将 一 个 12 位 宽 的 值 写 入 d) 将 一 个 12 位 宽 的 值 写 入 D 


5..0 


图 8-1 存储 位 宽 映射 


如 果 变 量 的 位 宽 比 存储 器 的 位 宽 还 小 ,或 者 正好 是 存储 器 位 宽 的 整数 倍 ,那么 变量 折 
全 工作 就 非常 简单 。 如 :图 8-1a 中 的 变量 声明 必须 被 映射 到 一 个 8 位 宽 的 存储 侨 上 ,如 图 8- 
1b 所 示 ,变量 A 和 B 被 分 别 分 配 了 1 个 和 2 个 存储 器 字 。 
如 果 变 量 的 位 宽 不 是 存储 器 位 宽 的 整数 倍 , 则 有 两 种 映射 方式 。 对 于 12 位 宽 的 变量 C, 
低 8 位 被 分 配 了 一 个 存储 器 地 址 ,而 高 4 位 则 被 映射 到 连续 的 下 一 个 地 址 ,如 图 8-1b BAN. 
对 于 另 一 个 12 位 宽 的 变量 DAK 6 位 被 映射 到 一 个 地 址 ,而 高 6 位 被 映射 到 连续 的 下 一 个 地 
址 。 第 一 种 方法 在 将 变量 C 写 人 存储 器 的 时 候 需 要 的 多 路 选择 器 比较 小 ,但 是 需要 有 8 个 总 
线 驱动 器 连接 在 存储 器 数据 总 线 上 ,如 图 8-lc 所 示 。 后 一 种 方法 需要 一 个 较 大 的 多 路 选择 
器 ,但 是 只 需要 .6 个 总 线 驱动 器 连接 在 存储 器 数据 总 线 上 ,如 图 8-1d 所 示 。 


8.2.2 存储 地 址 转换 

为 已 经 映射 到 存储 器 的 变量 分 配 地 址 和 修改 所 有 的 对 这 些 变量 的 引用 的 工作 称 为 存储 地 址 转换 。 

存储 器 地 址 的 分 配 和 变量 的 处 理 顺序 无 关 。 每 个 变量 需要 的 存储 字数 可 采用 变量 折 鱼 方 
法 确定 。 一 个 数组 变量 中 的 元 素 必须 分 配 在 一 段 连续 的 存储 区 域 中 。 

对 于 标量 变量 ,存储 地 址 的 变换 相对 直接 。 假 设 一 个 标量 V , 它 属 于 一 组 变量 ,这 组 变量 
表示 为 数组 MEM, MH. V 被 分 配 在 MEM 中 地 址 30 的 位 置 。 系 统 描述 中 所 有 对 变量 V 的 
引用 都 被 简单 地 替换 成 为 MEM (30)。 

对 于 数组 变量 ,如 果 它 和 别 的 变量 被 组 合 在 一 起 ,那么 这 个 变量 的 索引 地 址 必须 在 细 化 这 
个 变量 的 引用 的 时 候 进行 更 新 。 例 如 ,如 果 对 于 一 个 数组 变量 V(63 downto 0), 它 被 分 配 到 
MEM 的 100 到 163 地 址 ,我 们 在 更 新 对 V 的 引用 的 时 候 必须 考虑 如 下 情况 : 





设计 描述 细 化 109 


首先 ,如 果 数 组 变量 V 是 完全 通过 立即 数 索 引 的 ,那么 对 它 的 引用 可 以 简单 地 替换 成 为 
对 MEM 的 引用 。 这 样 , VORE RA MEM(100) ,而 V(36) 被 替换 为 MEM (136). 


其 次 ,如 果 该 数组 是 通过 包含 变量 的 表达 式 索 引 的 ,那么 ,相对 于 数组 变量 第 一 个 元 素 的 


初始 存储 器 地 址 的 一 个 偏 移 量 必须 被 加 在 表达 式 中 。 例 如 ,一 个 数组 变量 V ,用 K 和 J 作为 
索引 ,如 图 8-2a 中 代码 所 示 。 由 于 Y 被 分 配 到 MEM 中 100 开始 的 地 址 ,那么 V(J) 被 替换 
为 MEM(J +100), V(K ) 被 替换 为 MEM( 开 +100) ,如 图 8-2b 所 示 。 

variable J, K :integer := variable J, K : integer := variable J: integer = 100 


variable V: intArray (63 downto 0); variable MEM : IntAray (55 downto 0}; variable K : integer := a 
EM(K +100) ;= 3; variable MEM : Array (255 downto 0); 


VK = 
Xe vise): X ONEM (1 eure MEM 100 
VJ) = X; mn 00) = on = MEM 3). = 3; 


for J inOto63kop for Jin 0 to 63 loop EM) = X; 
SUM = SUM VO): SUM = SUM © MEM(J +100); ior J in 100 to 163 loop 
end loop: end loop; SUM := SUM + MEMU; 





a) 原始 描述 b) F 的 所 有 索引 表达 式 加 入 c) 更 新 家 引 变 量 ./ 后 的 描述 
偏 移 量 后 的 描述 


8-2 存储 器 地 址 转换 


再 次 ,如 果 一 个 变量 只 用 来 索引 一 个 数组 ,那么 ,可 以 通过 对 地 址 变量 进行 适当 的 初始 化 
来 避免 添加 偏 移 量 的 工作 。 例 如 ,在 图 8-2a 中 ,变量 只 用 来 索引 数组 变量 V ,图 8-2c 说 明 如 
何 通 过 初始 化 变量 (包括 在 for-loop 循环 中 ) 来 消除 对 添加 偏 移 量 的 需要 。 然 而 ,如 果 变 量 J 
用 来 索引 多 个 数组 ,本 方法 则 可 能 不 再 适用 。 在 这 种 情况 下 ,我 们 可 以 把 一 个 数组 分 配 在 0 地 
址 开始 的 存储 区 域 中 ,从 而 至 少 减 少 一 次 存储 偏 移 量 添加 工作 。 


8.3 通道 细 化 

在 一 个 系统 描述 中 ,并 发 行为 通过 在 抽象 的 通信 通道 上 发 送信 息 彼此 进行 通信 。 为 了 减 
小 互联 代价 ,系统 中 的 通道 会 被 结 群 ,同一 个 群 中 的 通道 用 同一 个 物理 媒介 实现 , 称 为 总 线 
(bus)。 一 条 总 线 包含 一 组 连 线 ,实际 的 数据 传输 就 是 在 这 些 连 线 上 按照 一 个 总 线 协议 实现 
的 。 为 每 组 通道 生成 总 线 以 及 传输 协议 的 工作 就 称 为 接口 细 化 。 在 本 节 我 们 就 讨论 接口 细 化 
的 方法 。 本 节 中 的 “行为 ”是 指 一 组 并 发 行为 中 的 一 个 ,通常 称 为 一 个 进程 。 


8.3.1 通道 和 总 线 的 表征 

对 于 任何 通道 ,都 只 有 一 个 主 (master) 行 为 发 起 和 控制 数据 传输 ,同时 有 多 个 从 (slave) 行 
为 对 主 行为 发 起 的 通信 做 出 响应 。 如 果 主 行为 通过 通道 发 送 (或 接收 ) 数 据 , 则 通道 的 相应 方 
向 为 写 (或 读 ) 。 通 道 通常 是 单 向 的 ,这 意味 着 如 果 一 个 行为 要 对 另 一 个 行为 中 的 某 个 变量 既 
要 读 又 要 写 ,就 需要 为 每 个 方向 的 数据 传输 建立 单独 的 通道 。 

通道 由 4 个 参数 来 表征 。 评 估 这 些 参 数值 的 方法 见 第 7 章 。 通 道 数 据 大 小 (channel data 
size) bits(C) 表 示 通 过 通道 C 传输 的 单个 消息 的 位 数 。 数 据 大 小 包括 为 了 和 通过 通道 访问 数组 
变量 所 需要 的 任何 地 址 位 。 访 问 数 (number of accesses) access (P, ORMIT A P ERE mH 
内 通过 通道 C 传输 数据 的 次 数 。 通 道 平均 速率 (channel average rate) avgrate(C) 是 通过 通道 
C 进行 通信 的 行为 在 其 生命 期 内 进行 数据 传送 的 平均 速率 。 通 道 峰 值 速率 (channel peak 
rate) peakrate(C) 是 单个 消息 在 通道 C 上 传输 的 速率 。 
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用 于 实现 任何 通道 或 者 通道 群 的 总 线 都 可 用 4 个 参数 来 表征 。 总 线 宽 (buswidth ) 
buswidth (B) ERE B 中 的 数据 线 数目 ,行为 间 的 消息 通过 这 些 数据 线 进行 传输 。 每 条 总 线 
都 有 一 个 相应 的 协议 ,该 协议 定义 了 一 系列 操作 以 实现 数据 在 这 些 数据 线 上 的 传输 。 协 议 时 
延 (protocol delay) protdelay( 卫 ) 是 在 总 线 上 进行 一 次 数据 传输 时 协议 所 占 的 总 时 延 。 平 均 总 
线 速 率 (average bus rate) avgrate( 也 ) 在 系统 的 总 生命 周期 内 ,数据 在 总 线 上 的 平均 传输 速率 。 
总 线 峰值 速率 (peak bus rate) peakrate (B) 是 数据 通过 总 线 的 最 大 传输 速率 。 总 线 峰 值 速率 


和 总 线 宽 之 间 有 如 下 关系 : 
buswidth (B) (8-1) 
protdelay(B) g 





peakrate( B) = 


8.3.2 问题 的 定义 

给 定 一 组 抽象 通信 通道 ,接口 细 化 确定 实现 这 些 通 道 的 总 线 宽 和 协议 。 接 口 细 化 通常 由 
两 个 相互 矛盾 的 目标 来 驱动 。 首 先 , 它 试图 通过 减 小 总 线 宽 buswidth (B) 来 最 小 化 系统 组 件 
之 间 通 过 总 线 的 互联 代价 。 其 次 , 它 寻 求 通过 增加 总 线 的 峰值 速率 peakrate (B) 来 最 大 化 总 
线 的 通信 性 能 ,从 而 增加 总 线 的 宽度 buswidth(B). 

接口 细 化 包含 两 个 任务 :总 线 生成 和 协议 生成 。 给 定 一 组 约束 ,总 线 生成 确定 总 线 的 沉 
度 , 该 总 线 用 于 实现 通道 组 。 当 总 线 宽度 确定 后 ,协议 生成 选取 并 且 生 成 通信 协议 ， 该 内 议 最 
终 实 现 数据 在 总 线 上 的 传输 。 我 们 将 分 别 讨论 总 线 生成 和 协议 生成 。 


8.3.3 BAER 
本 节 中 ,我们 将 介绍 在 实现 一 组 通道 的 过 程 中 确定 总 线 线 宽 的 方法 。 
在 [FKCD93] 中 介绍 了 一 种 简单 的 总 线 宽 生成 方法 ,在 这 种 方法 中 ,所 有 的 被 结 群 在 一 起 
的 通道 都 有 相同 的 消息 大 小 。 在 这 种 情况 下 ,通道 是 以 这 样 的 方式 进行 合并 的 , 即 在 同样 两 个 
行为 之 间 通 信 的 时 候 ,任何 通道 组 中 的 所 有 通道 都 应 该 在 时 间 上 是 独占 使 用 的 。 因 此 ,每 个 通 
道 组 就 采用 与 组 中 任何 通道 大 小 相同 的 总 线 线 宽 来 实现 。 
BRB 





图 8-3 典型 的 总 线 , 通过 将 在 若干 行为 间 传 输 不 同 大 小 数据 的 通道 合并 而 成 

在 更 一 般 的 情况 下 ,行为 通过 结 群 在 一 起 的 通道 进行 通信 的 时 候 , 希 望 能 够 通过 共享 的 物理 介 
质 进 行 同时 通信 。 另 外 ,不 同 的 通道 也 可 能 在 行为 间 传 递 不 同 大 小 的 消息 。 这 种 情况 在 图 8-3 中 进 
行 了 展示 。 行为 P.Q、R、S 通过 通道 X. YZ 进行 通信 。 通 道 X YZ 在 系统 划分 的 时 候 已 经 被 
划分 在 一 起 ,并 且 用 一 个 单独 的 总 线 B 实现 。 三 个 通道 通过 总 线 分 别传 递 三 种 不 同 大 小 的 数据 , 即 
分 别 为 8 位 .16 位 和 12 位 。 此 外 ,行为 P 向 行为 R 传递 数据 的 时 候 , 行 为 Q 也 需要 向 行为 S 传递 
信息 。 这 种 针对 一 般 情况 的 总 线 生成 方法 在 [NG94] 中 有 所 介绍 。 我 们 下 面 详细 讨论 这 种 方法 。 

”1. 确定 总 线 速率 
让 我 们 来 考虑 两 个 通道 ,X 和 了, 分 别传 递 8 位 和 16 位 消息 ,如 图 8-4 所 示 。 每 个 消息 传 
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递 的 位 数 标示 于 消息 上 方 。 为 简单 起 见 ,我 们 假设 图 中 所 示 的 4 秒 时 间 间 隔 代 表 了 行为 在 整 
个 生命 周期 中 通过 通道 X 和 Y 进行 通信 的 信息 传递 状况 。 可 以 看 到 ,通道 X MY 的 平均 速 
率 分 别 是 4 位 / 秒 和 12 位 / 秒 。 如 果 X AY 被 合并 到 一 条 总 线 B 中 ,那么 总 线 的 速率 需要 至 
少 达到 16 位 / 秒 , 这 样 才能 满足 这 两 个 原始 通道 的 需求 。 通 过 通道 传递 的 每 个 信息 都 已 经 在 
图 上 进行 了 标示 ,以 易于 与 共享 总 线 的 传输 数据 相关 联 。 考 虑 t = 1 秒 时 刻 在 原始 的 Y 通道 
上 传递 的 消息 Y2 ,现在 要 在 总 线 B 上 在 上 =1.5 秒 时 刻 进行 传递 。 虽 然 单个 消息 的 传递 可 能 
因为 总 线 访问 冲突 而 时 延 ,但 在 通道 合并 之 前 通过 单个 通道 传递 的 总 位 数 仍 在 同样 的 时 间 内 
通过 共享 总 线 进行 传递 。 
平均 数据 
_ 传输 速率 _ 


(2X8 位 )/4 秒 
=4 位 / 秘 


(3X16 位 )/4 秘 
=12 位 / 秒 


通道 Y 


(4+12 位 / 秘 ) 
=16 位 / 秒 





t=0 7 Is 2s | 3s 4s 时 间 
图 8-4 将 通道 XxX 和 Y 合并 到 总 线 B 


在 对 如 图 8-4 所 示 的 总 线 B 进行 综合 的 时 候 , 我 们 应 该 充分 利用 这 样 一 个 事实 : _ 条 通 
道 不 会 总 是 在 传输 数据 。 如 果 我 们 将 总 线 综合 成 为 固定 传输 速率 的 ,那么 一 个 通道 的 空 用 时 
间 就 可 被 别 的 通道 利用 来 进行 数据 传递 。 

在 将 通道 合并 到 一 条 总 线 上 之 前 ,如 果 通 道 在 某 个 平均 速率 下 进行 数据 传递 ,那么 应 该 在 
总 线 上 以 同样 的 平均 速率 进行 数据 传递 。 这 个 目标 能 达到 的 条 件 是 :总 线 B 的 平均 速率 
avgrate(B) 必 须 大 于 单个 通道 的 平均 速率 之 和 。 这 样 : 


avgrate (B) 之 Dyavgrate (C) (8-2) 


总 线 生成 的 目标 应 该 是 : 在 以 最 少数 量 的 连 线 和 以 公式 (8- 2) 确 定 的 平均 速率 条 件 下 , 进 
行 总 线 综合 。 最 有 效 的 总 线 实现 是 :总 线 上 永远 没有 空闲 时 间 , 而 且 总 线 总 是 以 一 个 固定 的 速 
率 传输 数据 。 在 这 种 全 况 下 ,总 线 的 峰值 速率 和 平均 速率 是 一 样 的 : 

peakrate(B) = avgrate(B) (8-3) 

2. 总 线 生成 的 约束 | 

对 于 一 组 被 结 群 在 一 起 ,即将 被 实现 为 一 条 独立 总 线 的 通道 来 讲 , 可 针对 某 些 总 线 和 通道 
的 参数 来 规定 约束 和 相对 的 权重 。 

最 小 /最 大 总 线 宽 约 束 可 能 来 自 于 为 模块 或 芯片 所 规定 的 总 引 脚 约束 ,通过 总 线 进行 通信 
的 行为 映射 到 这 些 模 块 或 人 片上 。 

通道 平均 速率 的 约束 可 规定 为 确保 行为 不 会 因为 在 总 线 上 的 通信 时 延 所 减 慢 。 给 定 一 个 
通过 若干 通道 进行 通信 的 行为 的 执行 时 间 约 束 ,设计 者 可 为 在 各 种 通道 上 进行 通信 分 配 或 预 
留 时 间 , 通 道 的 最 小 平均 速率 约束 可 由 此 得 到 。 当 某 个 通过 通道 进行 通信 的 行为 代表 一 个 慢 


N 
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EASI , 即 不 能 以 快 于 某 个 速率 来 发 送 和 接收 数据 时 ,就 可 由 此 规定 最 大 通道 平均 速率 。 

在 某 些 情况 下 ,可 规定 最 小 通道 峰值 速率 ,以 确保 通道 上 某 个 消息 的 传递 不 占用 过 多 时 
间 。 例 如 ,考虑 图 8-5a 中 的 通道 X ,在 前 两 个 时 间 片 (上 =0 和 上 =1) 的 每 一 个 中 都 传递 16 位 
消息 , 剩 下 的 两 个 时 间 片 由 通过 通道 X 通信 的 行为 用 来 进行 内 部 计算 。 如 果 我 们 想 用 一 条 总 
线 实现 通道 ,根据 公式 8-2, 则 总 线 平均 速率 则 为 8 位 / 秒 ,产生 图 8-5b 的 运行 状况 。 现 在 行为 
就 需要 4 个 时 间 片 来 进行 总 线 通 信 。 这 显然 是 不 能 接受 的 ,因为 还 需要 额外 的 2 个 时 间 片 来 
执行 行为 的 内 部 计算 (在 图 8-5a 中 ,原来 在 时 间 片 上 =2 和 z=3 中 执行 )。 如 果 通 道 X 的 最 小 
峰值 速率 被 规定 为 16 位 / 秒 , 我 们 就 会 得 到 如 图 8-5c 所 示 的 总 线 实现 ,而 不 需要 附加 任何 时 
间 片 。 因 此 ,对 于 所 有 具有 最 小 峰值 速率 约束 的 通道 C, 有 如 下 公式 : 

peakrate( B) > peakrate(C) (8-4) 
在 规定 了 最 小 通道 峰值 速率 约束 的 情况 下 ,产生 的 总 线 在 某 些 时 候 会 是 空闲 的 。 












| avgrate(X)=8 位 / 秒 


avgrate(B)=8 位 / 秘 
a peakrate(B)=8 位 / 秒 


avgrate(B)=8 位 / 秒 


c) 总 线 B ! peakrate(B)=16 位 / 秘 


图 8-5 通道 峰值 速率 约束 : a) 通道 X 的 执行 跟踪 , b) 无 通道 峰值 速率 约束 下 
对 总 线 B 的 综合 , c) 在 16 位 / 秒 的 通道 峰值 速率 下 对 总 线 B 的 综合 


3. 确定 总 线 宽 的 算法 . 

前 面 ,我 们 已 经 介绍 了 总 线 生成 过 程 中 可 能 规定 的 约束 ,现在 我 们 就 提出 用 于 确定 总 线 宽 
的 算法 [NG94]。 算 法 假定 数据 线 和 控制 线 是 分 离 的 。 在 任何 给 定时 刻 , 只 有 一 个 通道 能 通过 
总 线 传 输 数 据 。 如 果 总 线 的 线 宽 大 于 地 址 和 数据 的 位 宽 , 那 么 地 址 和 数据 就 会 同时 通过 总 线 
进行 传递 ,否则 ,它们 就 要 分 两 次 分 别传 递 。 在 后 一 种 情况 下 ,地 址 位 必须 被 接收 行为 锁 存 。 
如 果 总 线 宽 小 于 要 传递 消息 的 大 小 ,那么 消息 就 会 分 若干 次 进行 传递 。 

所 有 通过 总 线 中 的 一 个 通道 进行 通信 的 行为 都 假定 是 同步 实现 的 。 因 此 ,通过 总 线 传递 
一 个 消息 需要 整数 个 时 钟 周期 。 通 过 总 线 访问 的 变量 被 建 模 成 为 一 个 独立 的 行为 ,该 行为 啊 
应 其 他 行为 的 请 求 ,通过 总 线 发 送 和 接收 数据 。 这 样 , 当 计算 一 个 通过 总 线 访 问 变量 的 主 行为 
的 执行 时 间 时 ,就 假定 具有 这 个 变量 的 从 行为 永远 都 是 准备 好 进行 数据 传输 的 ,也 就 是 说 , 通 
过 总 线 访问 变量 没有 同步 时 延 。 

总 线 宽 生成 算法 的 输入 包含 一 组 要 被 实现 在 一 条 总 线 上 的 通道 ,以 及 通道 传输 速率 约束 
和 总 线 宽 约束 。 算 法 的 输出 是 实现 该 通道 组 的 总 线 宽度 。 | 

总 线 宽 生成 算法 检查 一 系列 可 能 的 总 线 宽 。 对 每 个 总 线 宽 , 计 算 总 线 峰 值 速 率 和 每 个 通 
道 的 平均 速率 。 在 综合 一 条 持续 不 断 地 传输 数据 的 总 线 时 ,公式 8-2 和 公式 8-3 要 求 总 线 的 
峰值 速率 要 大 于 通道 的 平均 速率 之 和 。 每 个 满足 以 上 条 件 的 总 线 宽 都 是 一 个 可 行 的 总 线 实 
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现 。 对 这 组 可 行 的 总 线 实 现 ,每 个 都 对 应 一 个 不 同 的 总 线 宽 ,我 们 要 从 中 选择 一 个 代价 最 小 


的 。 如 果 没 有 约束 ,就 选择 单位 总 线 宽 , 这 对 应 于 顺序 的 数据 传输 。 


总 线 宽 生成 算法 如 算法 8.3.1 所 示 。 首 先 ,确定 算法 要 进行 检验 的 总 线 宽 范 围 。 最 大 总 


线 宽 marwidth 就 是 通道 上 传递 的 最 大 消息 的 大 小 。 最 小 总 线 宽 minwidth 就 是 1。 


算法 8.3.1: 总 线 宽 生成 


if no constraints specified then 
return(1) 

end if 

/* 计算 总 线 宽 的 范围 * / 

minwidth = 1 

maxwidth = Max( bits( C)) 


mincost = © 
mincostwidth = co 
for currwidth in minwidth to maxwidth loop 


/ x 计算 总 线 峰 值 速 率 * / 
peakrate(B) = currwidth + protdelay( B) 


/ * 对 currwidth 计算 通道 平均 速率 之 和 x / 
avgratesum 一 和; 
for all channels CE B loop 

access(P,C) X bits(C) 


comptime( P) + commtime (P) 
avgratesum = averatesum + avgrate ( C); 


avgrate(C) = 


end loop 


if( peakrate( B) > avgratesum ) then 
/ x 可 行 解 ,确定 最 小 代价 * / 
currcost = ComputeCost( currwidth ) 
if( currcost < mincost )then 
mincost = currcost 
mincostwidth = currwidth 
end if 
end if 


end loop 


if( mincost = °° ) 

then return( failure ) 

else return( :incostwidth ) 
end if 


变量 currwidth 表示 当前 正在 被 算法 估计 的 总 线 宽 。 对 于 每 个 在 (minwid 志 ， 
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maxwidth jb HAKI currwidth 值 ,总 线 峰 值 速 率 用 公式 8-1 计算 。 
估算 通道 平均 速率 的 方法 已 经 在 第 7 章 进行 了 介绍 。 为 简单 起 见 , 假 设 行为 P 只 有 一 个 


通道 C 用 来 传递 消息 。 当 前 总 线 宽 小 于 消息 位 数 的 时 候 ,需要 若干 次 (| PESTO pieg 
才能 完成 一 个 消息 的 传递 。 行 为 PP 的 通信 和 时间 可 以 通过 公式 计算 : 
commtime(P)= access(P,C) X ¢ | _bits(C)_ | x protdelay( B)) (8-5) 


currwidth 


使 用 上 面 计 算 的 commztime(P) 值 ,就 可 以 用 公式 7-18 来 估算 每 个 映射 到 总 线 的 通道 的 
320| 平均 速率 。 对 于 currwidth 的 每 个 特定 值 ,通道 平均 速率 的 总 和 保存 在 avgratesum 中 。 
如 乐 总 线 的 峰值 速率 ,用 peakrate (B) 表 示 , 比 所 有 通道 平均 速率 的 总 和 还 小 ,那么 cur- 
rwidth 就 是 一 个 不 可 行 的 总 线 实现 。 于 是 在 (minwidth , maxwidth ) 中 选取 另 一 个 较 大 的 总 
线 宽 ,再 计算 总 线 峰 值 速率 ,以 及 通道 速率 的 总 和 。 
如 果 总 线 峰 值 速率 比 各 个 通道 速率 之 和 大 ,那么 currwidth 表示 一 个 可 行 的 总 线 实 现 。 
对 于 任何 为 总 线 规定 的 总 线 宽 、 通 道 平均 和 峰值 速率 的 约束 , ComputeCost 过 程 计算 可 行 的 总 
线 实现 的 代价 :每 个 约束 的 违反 值 的 平方 再 乘 上 一 个 对 该 约束 规定 的 相对 权重 ,然后 将 所 有 这 
些 加 权 的 平方 值 求 和 。 例 如 :假设 只 规定 一 个 约束 ,就 是 限定 总 线 宽 的 最 大 值 为 maxwires。 
假设 k 表示 这 个 约束 的 相关 权重 。 对 任何 总 线 宽 的 值 currwidth ,总 线 的 代价 函数 定义 为 : 
ost = (kX (currwidth — maxwires))? currwidth > maxwires 
0 其 他 
还 可 定义 其 他 的 代价 函数 用 来 估算 特定 总 线 宽 的 代价 。 例 如 ,如 果 我 们 希望 总 线 用 最 少 
数量 的 连 线 实现 ,那么 代价 就 是 currwidth o 
如 果 对 通道 组 有 多 个 可 行 解 ,就 选择 代价 最 低 的 总 线 宽 来 实现 总 线 。 算 法 8.3.1 中 的 变量 
mincost 表示 所 有 可 行 实现 的 最 小 代价 ,而 变量 mincostwidth 则 表示 对 应 于 最 小 代价 的 总 线 宽 。 
如 果 在 检查 了 所 有 的 总 线 宽 后 都 没有 找到 可 行 解 ,那么 实现 这 组 通道 是 不 可 行 的 。 这 组 
通道 的 任何 一 种 实现 都 会 逐渐 造成 通过 总 线 通信 的 行为 的 时 延 。 这 种 情况 产生 于 当 我 们 把 大 
干 平均 速率 很 高 的 通道 结 群 在 一 起 ,用 一 条 总 线 来 实现 的 时 候 。 一 种 解决 方法 是 将 这 组 道 壹 
322| ” 拆 分 开 来 ,用 多 条 总 线 实 现 。 另 外 一 种 方法 是 从 不 可 行 解 中 选 一 个 代价 最 小 的 。 


comptime(P) 
access(P,C 


图 8-6 温度 控制 器 两 个 通道 的 消息 大 小 .通道 访问 次 数 及 计算 时 间 


(8-6) 










= 23 位 





4. 总 线 宽 度 生 成 的 一 个 例子 

我 们 以 一 个 温度 控制 器 为 例 来 说 明 总 线 宽度 生成 算法 。 控 制 器 包括 两 个 输入 ,用 于 感知 
房间 内 的 温度 和 湿度 ,并 检测 四 组 规则 来 控制 空调 的 操作 。 系 统 划 分 将 行为 和 数组 变量 映射 
到 两 个 不 同 的 系统 组 件 中 ,这 样 就 在 两 个 组 件 之 间 产 生 了 几 条 通道 。 温 度 控制 器 的 两 个 行为 
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P1 和 P2 分 别 通 过 通信 通道 1 和 ch2 访问 两 个 数组 变量 V1 和 V2, 这 两 个 通道 被 结 群 在 
一 起 用 一 条 总 线 B 实现 。 图 8-6 列 出 温度 控制 器 这 两 个 通道 的 通道 位 数 、 计 算 时 间 以 及 通道 
访问 次 数 。 为 简单 起 见 , 所 有 的 执行 时 间 和 数据 传输 率 都 用 控制 步 表 示 。 现 在 我 们 就 可 以 用 
总 线 宽度 生成 算法 来 确定 由 合并 两 个 通道 所 形成 总 线 的 宽度 了 。 假 设 总 线 实现 的 唯一 约束 是 
通道 ch2 的 最 小 峰值 速率 即 10 bits/clock( 位 /周期 ), 其 相对 权重 是 10。 

首先 ,我 们 确定 要 检验 的 总 线 宽度 的 范围 。ch1 和 ch2 都 要 访问 128 个 字 (7 个 地 址 位 ) 的 
数组 变量 ,每 个 字 的 长 度 是 16 人 位。 这样 ,任意 通道 上 的 任何 一 一 次 传输 所 需 的 最 大 位 数 就 是 
23。 总 线 宽度 的 检验 范围 就 是 . 

minwidth =1 和 maxwidth = 23 

我 们 从 currwidth = 18 计算 总 线 和 通道 的 速率 。 假 设 采用 完全 握手 协议 来 实现 总 线 , 而 

且 相 关 的 协议 时 延 是 2 个 时 钟 周 期 , 即 protdelay(B)=2 clocks。 根 据 式 8-1, 有 : 
peakrate(B) = 18+ (2) =9 bits/clock 

同样 对 于 currwidth = 18 bits, ch1 和 ch2 的 平均 速率 由 式 7-18 进行 计算 : 


avugrate(ch1) = (128 x 23) + [515 + (128 x | te 3 | x 2) ] =2.86 bits/clock 


avgrate(ch2) = (128 x 23) + [129+ (128x| 名 J x2)]=4.59 bits/clock 


由 于 两 个 通道 的 平均 速率 之 和 小 于 peakrate(B),18 位 的 总 线 宽 表示 一 个 可 行 的 实现 。 
我 们 现在 来 计算 这 个 总 线 宽 相应 的 代价 。 由 于 通道 的 峰值 速率 有 一 个 10 bits/clock 的 最 
小 约束 ,其 权重 为 10 ,而 总 线 的 峰值 速率 确定 为 9 bitsyclock ,所 以 
cost = (10 X (10 —9))? = 100 
对 <1,23> 范 围 内 总 线 宽度 的 其 他 取 值 重复 上 面 的 计算 ,就 产生 一 个 总 线 宽 和 代价 的 对 
应 图 ,如 图 8-7 所 示 。 根 据 这 个 图 ,最 小 的 代价 是 0, 对 应 的 总 线 宽度 是 20。 该 总 线 宽 度 将 用 
来 实现 包含 通道 ch1 和 ch2 的 总 线 。 
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图 8-7 温度 控制 器 : 成 本 与 总 线 宽 度 的 关系 


图 8-8 显示 出 两 个 通过 总 线 B 传输 数据 的 行为 Pl 和 P2 的 性 能 是 如 何 被 各 种 总 线 宽 所 
影响 的 。 对 每 个 总 线 宽 ,都 采用 一 个 性 能 评估 器 来 获得 行为 的 执行 时 间 。 很 明显 , 随 着 总 线 宽 


度 的 增加 ,行为 的 执行 时 间 减 少 。 给 定 这 些 行为 的 性 能 约束 ,设计 者 可 以 选择 一 个 合适 的 宽度 


来 实现 总 线 。 例 如 ,假设 行为 P2 有 一 个 2500 个 时 钟 周期 的 最 大 执行 时 间 约 束 , 如 图 8-8 中 
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虚线 所 示 。 从 这 条 虚线 与 P2 曲线 的 交点 ,我 们 可 以 得 出 结论 :只 有 大 于 4 bits/clock 的 总 线 宽 


525] 才 需 要 考虑 用 来 实现 总 线 。 


7000.0 
6000.0 | d 
5000.0 

= 4000.0 

z 3000.0 
2000.0 
1000.0 

0.0 


00 40 8.0 120 160 200 240 
总 线 宽 


图 8-8 温度 控制 项 : 执行 时 间 与 总 线 宽 度 的 关系 





8.3.4 协议 生成 

一 旦 我 们 选 定 了 合适 的 总 线 宽度 来 实现 通道 组 ,协议 生成 工作 就 是 要 定义 通过 总 线 的 数 
据 传 输 机 制 。 一 条 总 线 包括 三 组 线 : 

数据 线 :用 来 通过 总 线 传输 数据 。 数 据 线 的 数量 (总 线 宽度 ) 可 通过 总 线 宽度 生成 算法 来 
确定 ,或 者 由 设计 者 规定 。 

控制 线 : 用 来 同步 通过 总 线 进行 通信 的 行为 。 控 制 线 的 数量 取决 于 我 们 选择 了 哪 种 协议 
来 实现 数据 传输 。 例 如 ,标准 的 握手 协议 需要 两 个 控制 信号 , START 和 DONE。 信号 
START 由 主 行为 置 位 /复位 ,而 DONE 由 附 于 通道 的 从 行为 置 位 /复位 。 控 制 线 是 所 有 映射 
到 同一 条 总 线 的 通道 共享 的 。 

标志 线 或 模式 线 : 用 来 在 任何 时 间 点 标记 是 哪 一 条 通道 在 通过 总 线 传输 数据 。 由 于 总 线 
控制 信号 是 所 有 通道 共享 的 ,这 种 标志 (identification，ID) 线 在 本 质 上 的 重要 性 在 于 使 行为 辩 
别 什 么 时 候 总 线 上 的 控制 信号 对 其 是 有 意义 的 。 总 线 中 的 每 个 通道 被 赋予 一 个 唯一 的 ID, 作 
为 这 个 通道 的 地 址 。 每 次 主 行 为 通过 总 线 发 起 一 次 数据 传输 , 它 就 将 相应 通道 的 ID 放 到 总 线 
的 ID 线 上 ,从 而 保证 只 有 对 应 的 从 行为 才 对 控制 信号 做 出 响应 。ID 线 也 可 以 直接 编码 到 通 
过 总 线 访问 的 数据 地 址 中 。 在 这 种 情况 下 ,从 行为 必须 有 一 个 地 址 检验 机 制 ,检查 传送 到 总 线 
的 每 个 地 址 ,以 确定 是 否 应 该 对 主 行为 发 送 到 总 线 上 的 控制 信和 号 做 出 响应 。 

我 们 通过 一 个 简单 的 例子 来 说 明 协 议 生 成 ,如 图 8-9 所 示 。 变 量 X MMEM 被 行为 已 和 
Q 访问 。 虚 线 表示 系统 行为 和 变量 到 系统 组 件 的 分 配 。 通 道 CHO、CH1、CH2 及 CH3 被 结 
群 到 总 线 B ,而且 总 线 宽度 已 经 被 确定 为 8 位。 协议 生成 包括 如 下 几 步 . 

1) 协议 选择 :为 实现 一 个 总 线 可 以 选择 各 种 通信 协议 ,如 完全 握手 协议 , 半 握 手 协议 ,其 
至 硬件 端口 。 每 个 协议 需要 不 同 数量 的 控制 线 。 对 于 图 8-9 中 的 总 线 B, 选 择 了 完全 握手 协 
议 。 用 两 个 控制 信号 START 和 DONE 来 实现 握手 协议 。 

2) ID 分配: 如 果 N 个 通道 实现 在 同一 个 总 线 上 , 则 需要 log2(N) 条 线 来 对 通道 ID 进行 
编码 。 每 条 通道 被 分 配 一 个 唯一 的 ID。 图 8-9 中 的 4 条 通道 需要 2 条 ID 线 。CH0 的 ID 是 
00, CH1 的 有 DD 是 01, 以 此 类 推 。 

3) 总 线 结构 和 过 程 定义 :为 总 线 所 确定 的 结构 (数据 、 控 制 及 DD 线 ) 是 在 描述 中 定义 的 。 
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MEM(60) := COUNT ; 
end 





图 8-9 行为 通过 结 群 成 总 线 的 通道 访问 变量 


type _HandShakeBus is record 
START, DONE : bit; 
1D. bit ector(| dow down 0 
end record ; ); 


signal B : HandShakeBus ; 
procedure ReceiveCHO( rxdata : out bit_vector) is 


Jin 1 to 2 loop 
wait unti (B.START = '1’) and (B.ID = °00") ; 
sr aty downto "(1 <= B.DATA . 


procedure Sere Daman BR vin is 





图 8-10 ”定义 总 线 B 以 及 通道 CHO 的 发 送 和 接收 协议 


对 于 映射 到 总 线 上 的 每 条 通道 ,需要 生成 适当 的 发 送 和 接收 过 程 ,封装 对 总 线 的 控制 线 、 数 据 
线 及 ID 线 的 一 系列 赋值 操作 以 执行 数据 传输 。 图 8-10 显示 出 对 一 条 8 位 总 线 的 声明 , 它 有 
PRAMA ID 线 。 总 线 B 被 声明 为 全 局 变量 (在 VHDL 中 就 是 一 个 信和 号) ,这 样 所 有 
行为 都 可 以 访问 它 。 行 为 P 通过 通道 CHO 向 一 个 16 位 变量 X 写 人 。 由 于 总 线 宽度 只 有 8 

他 图 8-10 b 中 通道 CHO 的 过 程 SendCHO 和 ReceiveCHO 通过 总 线 发 送 一 个 16 位 的 六 息 ， 
分 两 次 传递 ,每 次 传送 8 位 。 

4) 更 新 变量 引用 :如 果 一 个 变量 被 系统 划分 过 程 分 配 到 另 一 个 系统 组 件 上 ,那么 原来 对 
这 个 变量 进行 的 直接 引用 就 必须 更 新 。 对 变量 的 访问 将 被 替换 成 为 发 送 和 接收 过 程 调用 ,该 
调用 对 应 于 进行 变量 访问 的 通道 。 例 如 ,在 图 8-9 中 ,行为 已 直接 向 X 写 了 一 个 值 *32”。 
CHO 现在 负责 向 X 写 和 数据。 语句 “X< = 32” 被 替换 成 为 发 送 过 程 调用 “sendcH0(32)”, 如 
图 8-11 Pra. 行为 Q 中 的 语句 “mem(60) : = count” 也 被 替换 为 “sendch3(60,count)”, 指 明 
COUNT 的 值 应 该 写 到 数组 MEM 的 地 址 60 处 。 

5) 为 变量 生成 进程 :为 了 获得 可 模拟 的 系统 描述 ,为 每 组 通过 通道 访问 的 变量 都 生成 一 
个 单独 的 行为 。 该 行为 包括 合适 的 接收 和 发 送 过 程 调用 ,以 响应 通过 总 线 对 这 些 变量 的 访问 
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”请 求 。 在 图 8-9 中 ,变量 X 和 MEM 被 分 配 到 不 同 的 系统 组 件 上 ,如 虚线 所 示 。 在 图 8-11 中 ， 
行为 Xproc 和 MEMproc 专门 为 这 两 个 变量 创建 。 








process P 
variable AD Xtemp; 
begin | 





HO(X); 
elsif (B.ID="01" ) then 
sendCH1(x); 


RecetveCH1 (Xtemp); 
SendCH2(AD, Xtemp+7); 





process MEMproc 
variable MEM: array(0 to 63); 
begin 
wait on B.ID; 
it 从 .ID= ”10 ) then 
rece 2(MEM): 
elsif (B.ID="11" } then 
receiveCH3(MEM); 
end if; 
end; 


图 8-11 协议 生成 后 的 细 化 描述 


本 节 介 绍 的 协议 生成 有 几 点 优势 。 首 先 , 细 化 的 描述 是 可 模拟 的 ,而 设计 的 功能 在 插入 了 
总 线 和 通信 协议 后 是 可 验证 的 。 其 次 ,通过 对 以 发 送 和 接收 过 程 调用 的 数据 传输 的 封装 ,即使 
我 们 在 行为 的 每 个 通信 点 上 都 插入 控制 线 和 数据 线 , 那 么 行为 的 描述 依然 清晰 而 不 混乱 。 最 
后 ,即使 在 后 面 阶段 选择 了 另 一 个 通信 协议 ,只 有 总 线 声明 发 送 过 程 接收 过 程 需要 改变 。 系 
统 行为 描述 ,包括 发 送 和 接收 过 程 的 调用 ,都 无 需 改 变 。 


8.4 解决 访问 冲突 


当 系 统 中 两 个 或 多 个 行为 试图 同时 访问 同一 个 资源 的 时 候 , 就 会 发 生 访问 冲突 。 例 如 , 系 
统 划 分 中 的 变量 和 通道 结 群 就 会 造成 这 种 冲突 。 结 群 在 一 起 的 变量 也 许 会 被 多 个 行为 并 发 访 
问 。 如 果实 现 一 组 变量 的 存储 器 的 端口 数 比 并 发 访问 需要 的 少 ,那么 访问 冲突 就 会 发 生 。 类 
似 地 ,通信 通道 也 会 被 结 群 在 一 起 ,用 一 条 总 线 实现 。 通 过 这 些 通道 通信 的 行为 也 会 试图 同时 
进行 数据 传输 ,从 而 导致 对 总 线 的 竞争 。 

仲裁 (arbitration) 用 来 解决 由 于 多 个 行为 并 发 访问 一 个 共享 资源 而 导致 的 冲突 。 仲 裁 生 
成 是 一 个 细 化 任务 ,用 于 当 系 统 中 存在 资源 竞争 时 ,在 描述 中 插入 仲裁 机 制 。 


8.4.1 仲裁 模型 

资源 通常 拥有 多 个 访问 端口 ,支持 有 限 数量 的 并 发 访问 。 这 种 资源 的 一 个 实例 是 多 端口 
存储 器 , 它 有 固定 数量 的 端口 。 如 果 对 这 种 资源 进行 并 发 访问 的 行为 数量 超过 了 访问 端口 数 ， 
我 们 就 要 解决 并 发 访问 冲突 。 通 常 采用 两 种 仲裁 模型 :静态 仲裁 和 动态 仲裁 。 这 里 将 以 行为 
对 一 个 2 端口 存储 器 进行 访问 的 例子 对 这 些 模型 加 以 说 明 , 如 图 8-12 所 示 。 

在 静态 仲裁 (static arbitration) 模 型 中 ,一 个 行为 的 访问 被 分 配 到 存储 器 的 特定 端 口 。 在 
图 8 .12a 中 ,行为 PP 通过 port2 访问 存储 器 Mem ,而 行为 Q 和 R 通过 portl 访问 存储 器 
Mem 。 访 问 到 特定 端口 的 映射 是 静态 的 , 即 在 系统 的 生命 周期 中 ,一 个 行为 都 是 通过 分 配给 
它 的 端口 访问 数据 。 在 这 种 模型 下 ,只 有 通过 同一 个 端口 的 并 发 访问 才 被 仲裁 。 因 此 ,就 需要 
仲裁 器 MemArbiter 来 解决 行为 Q 和 R 对 port1 的 访问 冲突 。 虽 然 静态 仲裁 模型 实现 简单 ， 

但 可 能 导致 很 差 的 性 能 。 由 于 端口 赋值 是 静态 进行 的 ,就 可 能 需要 一 个 行为 等 待 静 态 分 配给 
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图 8-12 ”仲裁 模型 


在 动态 仲裁 (dynamic arbitration) 模 型 中 ,行为 可 以 在 不 同 的 时 间 访 问 不 Ejim HO ,取决 于 
端口 是 否 可 用 。 在 图 8-12b 中 ,所 有 三 个 行为 都 通过 开关 网 络 连接 到 两 个 存储 器 端口 。 仲 裁 
器 MemArbiter 限制 在 任何 时 刻 最 多 只 能 有 两 个 行为 访问 存储 器 MEM 。 这 种 模型 的 主要 优 
势 是 具有 更 高 的 端口 利用 率 ,并 因此 达到 访问 存储 器 行为 的 更 快 执行 。 然 而 ,动态 仲裁 需要 更 
复杂 的 实现 ,因为 MemArbiter 除了 选择 哪个 行为 被 允许 访问 存储 器 以 外 ,还 必须 把 来 自 二 个 
行为 的 数据 连接 到 两 个 存储 紫 逆 口 。 


8.4.2 ”仲裁 方案 


给 定 资源 ,仲裁 方案 就 用 于 确定 它们 之 间 的 相对 优先 级 ,以 解决 可 能 的 访问 冲突 ,仲裁 方案 可 
以 分 为 固定 优先 级 和 动态 优先 级 两 种 。 我 们 下 面 分 别 换 述 。 

1. 固定 优先 级 

固定 优先 级 (fixed 一 priority) 方 案 为 每 个 行为 静态 地 分 配 一 个 优先 级 。 行 为 间 的 相对 优 
先 级 在 整个 系统 的 生命 周期 内 都 是 不 变 和 的 。 如 果 两 个 行为 同时 请 求 访问 一 个 共同 的 资源 , 则 
具有 较 高 优先 级 的 行为 将 被 授予 访问 权 。 然 而 ,静态 优先 级 方案 也 有 可 能 是 抢占 优先 的 , 如果 
某 个 行为 正在 访问 一 个 共享 资源 ,而 有 一 个 更 高 优先 级 的 行为 也 要 访问 ,那么 正在 访问 共享 资 
源 的 行为 就 必须 放弃 访问 而 将 访问 转 给 高 优先 级 的 行为 。 一 个 抢占 优先 级 的 例子 就 是 Intel 
8237 的 DMA 控制 器 , 允许 较 高 优先 级 的 外 设 抢占 较 低 优先 级 外 设 的 资源 。 

为 各 种 行为 确定 固定 优先 级 取决 于 度量 ,该 度量 还 将 被 优化 。 其 中 一 个 度量 是 平均 等 符 
时 间 ,表示 任何 行为 等 待 对 共享 资 沾 的 访问 所 需 的 平均 时 间 。 一 个 低 平 均等 待 时 间 表示 行为 
获取 共享 资源 的 速度 很 快 ， 

DORE ,行为 的 优先 级 分 配 应 该 以 最 小 化 平均 等 待 时 间 为 目标 。 对 于 一 个 行为 特定 的 优先 
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级 分 配 ,平均 等 待 时 间 只 能 通过 对 摘 述 进 1 了 模拟 而 动态 地 确定 。 为 了 静态 地 确定 行为 的 优先 
级 ,平均 等 待 时 间 通 常用 相对 容易 估计 的 度量 来 近似 。 一 种 度量 就 是 行为 访问 的 数据 的 大 小 。 
例如 ,如 果菜 个 行为 通过 通道 一 次 性 传输 大 量 的 数据 ,那么 这 个 行为 就 会 被 赋予 一 个 较 低 的 优 
332| 先 级 ,以 避免 在 数据 传输 期 间 , 其 他 行为 长 时 间 都 无 法 通过 总 线 传递 数据 。 男 一 个 认为 会 降低 

平均 等 待 时 间 的 度量 是 行为 对 共享 资源 的 访问 频率 (frequency of accesses)。 行 为 的 访问 频率 
越 高 ,优先 级 也 就 应 该 越 高 。 

在 确定 行为 的 优先 级 的 时 候 , 系 统 设计 者 可 以 使 用 一 种 标准 ,也 可 以 使 用 多 种 标准 的 加 权 
组 合 。 

动态 优先 级 (dynamic-priority) 方 案 在 系统 运行 的 时 候 根 据 系 统 状 态 确定 行为 的 优先 级 。 
例如 ,循环 优先 (round-robin) 方 案 给 最 近 访 问 共享 资源 的 行为 赋予 最 低 的 优先 级 。 先 来 先 服 
务 (first-come-first-served) 方 案 根 据 行为 访问 请 求 的 到 来 顺序 决定 行为 的 优先 级 。 这 种 方案 的 
特点 是 对 行为 获得 授权 访问 资源 没有 一 个 绝对 顺序 。 所 以 ,动态 仲裁 方案 可 看 做 平等 的 , 换 何 
话说 ,一 个 行为 不 会 为 了 获得 对 共享 资源 的 访问 而 无 限 等 每 。 


8.4.3 ”仲裁 器 生成 
一 旦 选择 了 仲裁 方案 ,就 以 仲裁 方案 为 基础 为 不 同行 为 对 共享 资源 的 访问 确定 优先 级 。 
为 了 实现 对 并 发 访问 的 仲裁 ,需要 生成 一 个 仲裁 行为 ,并 插入 描述 中 。 本 节 将 以 固定 优先 级 仲 
SAR WERE NAA ROAR AREER. 
共享 资源 的 仲裁 机 制 都 由 一 个 独立 的 行为 米 表示 ,该 行为 和 所 有 要 访问 该 资源 的 行 
大 是 并 发 的 ”在 行 炎 中 每 次 对 其 训 次 尖 的 访问 孝 被 从 羽 Ln AF yA RIBS MUR 
机 制 。 一 个 需要 访问 资源 的 行为 将 通过 断言 请 求 信号 Reg 向 仲裁 器 发 出 请 求 。 仲 裁 器 检查 
[333| 多 个 行为 的 访问 请 求 ,通过 断言 适当 的 Grane 信号 ,给 最 高 优先 级 的 行为 授予 访 问 权 。 
算法 8.4.1: 生 成 仲裁 器 | 


/* 在 行为 中 引入 请 求 和 授权 信号 * / 
for each behavior B; which accesses resource R loop 
Precede all accesses of R in B; by the following: 
Req_i <='1’; 
wait until (Grant _i =’1’); 
Append the following after all accesses of R in B;: 


Req_i <=’0’; 
end loop 
/A/#* 生成 仲裁 行为 x* / 


Add the following to head of the arbiter behavior: 

wait untill Req_ 1 or Req_ 2 or.. or Req_N; 
while priority _ list =? loop 

B, = First( priority _ list ) 

priority _ list = Tail( priority _ list ) 

Append the following to the arbiter process: 

if (Req_ k = 1’) then 
Grant_k <=’1’; 
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wait until (Req_k =’0’); 
Grant k <=’0'; 
end if; 


end for 


算法 8.4.1[RVNG921 生 成 了 一 个 给 定 资 源 R 的 仲裁 器 行为 VHDL HE. By Bit 
访问 资源 R 的 行为 。 假 设 每 个 行为 的 优先 级 以 降序 保存 在 priority _ list 中 。 过 程 First( 工 ) 
BEIE L 的 第 一 个 元 素 , 而 过 程 Tall LR ER OL 的 第 一 个 元 系 后 的 列表 。 

在 图 8-11 中 展示 了 行为 P 和 Q 的 仲裁 器 生成 ,P 和 Q 通过 总 线 B 传输 数据 ,总 线 的 宽度 
和 协议 在 8.3 节 中 确定 。 假 设 行为 P 通过 总 线 B 传输 数据 的 优先 级 比 Q 大 。 为 总 线 BER 
的 仲裁 器 行为 B-arbiter 如 图 8-13 所 示 。 适 当 的 请 求 对 总 线 访 问 的 握手 信号 赋值 已 经 插入 到 1334 
主 行为 P 和 Q 中 了 。 当 行为 P 和 Q 需要 通过 总 线 传 输 数 据 的 时 候 , 它 们 分 别 通过 断言 Reg _ 
P HRe _Q 来 请 求 访问 总 线 。 行 为 B_arbiter 通过 断言 Grant _P RADARS Po 

Q 只 有 在 P 不 同时 请 求 访问 总 线 的 时 候 才 能 得 到 访问 总 线 的 授权 。 


process P 
variable AD Xtemp; 
in 


proc rocess MEM 
variable MEM: I array(O to 63); 
in 


rocess B_arbiter 
wait until (Req een) or (Req_Q = "1"; 
if (Reape 1’) then 


rant_P =’ 

wait ait unit Teg p= 0}; 
elsif {Req Q= 1) then 

Gr 


<= "|" 


wat until (Reg Q= 07: 
rant_Q 





图 8-13 为 总 线 B 生成 仲裁 行为 后 的 细 化 描述 


8.5 ” 细 化 不 兼容 接口 


系统 设计 人 员 可 能 会 把 单一 的 或 者 一 组 功能 对 象 绑 定 到 一 些 成 品 组 件 上 。 变 量 组 可 能 会 
被 绑 定 到 标准 存储 器 中 ,行为 可 能 会 被 绑 定 到 标准 芯片 或 处 理 器 上 ,通道 组 可 能 会 被 绑 定 到 标 [33S 
准 总 线 协议 上 。 这 些 标 准 组 件 的 引 脚 结构 和 通信 协议 是 固定 的 ,不 能 改变 。 在 系统 组 件 之 间 
通过 不 同 的 协议 通信 和 是 可 行 的 ,但 是 必须 引入 合适 的 接口 。 

为 了 检验 将 功能 对 象 绑 定 到 标准 系统 组 件 的 效果 ,我们 来 看 图 8-14a 中 的 通道 X,A MB 
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通过 它 传 输 数 据 。 假 设 P, 和 P, 分 别 表示 实现 行为 A 和 B 通信 的 协议 。 根 据 哪 些 行为 被 绑 定 
到 标准 组 件 , 有 以 下 3 种 情况 : 

1) 两 个 行为 都 没有 被 绑 定 在 标准 组 件 上 ,如 图 8-14a 所 示 。 它 们 之 间 的 通信 可 以 通过 在 
8.3 节 所 讲 的 方法 , 即 生成 总 线 并 在 行为 A MB 中 插入 协议 来 实现 。 

2) 其 中 一 个 行为 被 绑 定 在 标准 组 件 上 ,如 图 8-14b 中 的 行为 Bo UNM Ps 是 这 个 标准 组 件 
对 应 的 协议 ,是 不 可 改变 的 。 由 于 另 一 个 行为 A 是 定制 设计 的 , 它 的 协议 被 修改 成 为 对 于 P, 
是 兼容 的 ,用 于 保证 行为 A 和 B 仍旧 可 能 彼此 通信 。 对 已 ,的 修改 会 体现 在 行为 A 的 描述 中 。 

3) 两 个 行为 都 被 绑 定 在 标准 组 件 上 , 如 i zi 


图 8-14: 中 的 行为 A 和 已 。 这 种 情况 下 , P, A 通道 X 
P, 都 是 固定 的 。 如 果 两 个 协议 是 兼容 的 ,那么 


我 们 只 需要 简单 地 把 两 个 标准 组 件 的 对 应 端 ” 协议 : win 
口 正确 地 连接 起 来 就 能 确保 它们 能 正确 通信 定制 
了 。 但 是 ,如 果 Ps 和 PP 是 不 兼容 的 ,两 个 标准 P B 
组 件 之 间 就 需要 插入 一 个 接口 进程 。 接 口 进 
程 见 图 中 用 虚线 框 起 来 的 部 分 , 它 是 一 个 行 
为 ,为 两 个 协议 不 兼容 的 行为 提供 接口 ,以 便 
于 数据 传输 。 

除了 由 于 标准 组 件 的 使 用 导致 的 需求 外 ， 
接口 进程 还 用 在 其 他 的 一 些 环境 中 。 例 如 :由 gia 将 行为 绑 定 到 定制 或 标准 组 件 的 影响 
于 引 脚 数量 约束 导致 两 个 系统 组 件 的 数据 引 | 
脚 的 数量 不 同 。 不 同 的 数据 引 脚 数量 会 导致 两 个 系统 组 件 的 通信 协议 不 兼容 。 这 种 情况 下 ， 
就 需要 一 个 接口 进程 对 两 个 协议 进行 连接 。 

8.5.1 问题 的 定义 

接口 进程 生成 是 一 个 细 化 任务 , 它 在 两 个 固定 的 且 不 兼容 的 协议 的 通信 行为 之 间 定 义 一 
个 接口 进程 。 接 口 进程 生成 的 目标 是 生成 一 个 接口 进程 , 它 正确 地 响应 两 个 协议 的 控制 信号 ， 
在 它们 之 间 传 输 数 据 。 换 句 话说 ,接口 进程 把 一 个 协议 翻译 给 另 一 个 协议 。 例 如 :一 个 组 件 的 
协议 一 次 传输 16 位 数据 ,但 是 另 一 个 组 件 一 次 只 能 够 接收 8 位 数据 。 接 口 进程 就 从 前 一 个 组 
件 接受 16 位 数据 ,然后 分 两 次 ,每 次 8 位 数据 传递 给 后 一 个 组 件 。 接 口 进 程 生 成 的 另 一 个 目 
标 是 获得 一 个 可 模拟 的 细 化 描述 。 

8.5.2 通信 协议 描述 

在 阐述 接口 进程 生成 技术 之 前 ,我们 简要 考察 一 下 通信 协议 描述 的 方法 。 

一 个 协议 包含 一 组 原子 操作 。 原 子 操作 有 五 类 :(1) 在 输入 控制 线 等 待 一 个 事件 ; (2) 为 
输出 控制 线 分 配 一 个 值 ;(3) 从 输入 数据 线 读 取 值 ;(4) 为 输出 数据 线 分 配 值 ;(5) 等 待 一 个 固 
定 的 时 间 间 隔 。 任 何 协议 都 可 以 采用 上 面 五 类 原子 操作 的 组 合 来 描述 。 

通信 协议 通常 使 用 三 种 方式 来 描述 :状态 机 、 时 序 图 和 硬件 描述 语言 。 在 图 8-15 中 对 每 
种 描述 都 用 例子 示意 。 

在 图 8-15a 中 ,行为 A AB 都 被 映射 到 标准 组 件 。 行 为 A 读 一 个 64K x 16 的 存储 从 , BI 
行为 B 中 的 变量 MemVar。 两 个 行为 有 固定 的 协议 PA Pro WI PO 有 8 位 地 址 线 、16 位 数 
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_ 标准 组 件 


ee 
CC 





a 8 位 地 址 线 ， 16 位 地 址 线 ， sis 





”16 位 数据 线 ， 16 位 数据 线 ， 
4 位 控制 线 1 位 控制 线 
a) 两 个 行为 4 和 8B 具有 固定 协议 P, 和 P， 
协议 协议 
开始 开始 
ADDAp <= AddVar? downto 0 
(ARCVp ='1') (RDp = ‘1’) 
GÀ ee Se re (b2) MAddrVar := MADDRp 
(ORDYp ='1') {100 ns) 
DataVar <= DATAp Mo (MA drVar) 
b) 状态 机 表示 





100 nsi 


c) 时 序 图 表示 


DAT. 
pe os downto 0); 


it for 100 ns; 
MDATAp <= MemVar (MAddrVar}; 





d) HDL 表示 
图 8-15 协议 表示 


据 线 和 4 位 控制 线 ,而 协议 PA 16 位 地 址 线 、16 位 数据 线 和 1 位 控制 线 。 协 议 P, 使 用 的 变 
量 AddrVar 及 DataVar 和 协议 已 中 使 用 的 变量 MemVar 都 是 相应 行为 的 局 部 变量 ,提供 分 
配 到 数据 线 的 相关 数据 ,或 者 接收 从 数据 线 读 取 的 相关 数据 。 例 如 ,协议 已 中 的 变量 Addr- 
Var 提供 了 16 位 的 地 址 ,指向 存储 器 中 的 一 个 单元 , 主 行为 A 对 其 进行 访问 。 为 了 便于 识 
别 ,所 有 端口 名 称 都 有 一 个 “p" 后 级 。 

8-15b 显示 了 表示 协议 P, 和 Ps 的 状态 机 ,分 别 对 应 于 行为 A 和 已 。 状 态 间 的 迁移 由 输 
入 信号 线 上 的 事件 的 触发 。 例 如 :在 P, 的 状态 机 中 , ARCVp 上 升 为 "1 ”的 事件 ,导致 从 cz 到 
a3 的 状态 迁移 。 在 每 个 状态 ,都 可 以 向 端口 赋值 或 者 从 端口 读 取 值 。 在 图 8-15b 中 ,状态 al 
赋值 到 地 址 端口 ADDR, 和 控制 端口 ARDY,。 连 续 事 件 之 间 的 时 延 可 以 直接 描述 为 迁移 的 
条 件 , 如 P; 状 态 机 的 状态 52 和 63 之 间 有 100 ns 的 时 延 。 其 他 方法 还 采用 特殊 的 时 延 弧 
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(timing art) 来 表示 协议 中 任何 两 个 事件 之 间 的 时 序 约束 。 协 议 的 状态 机 描述 的 缺点 与 在 第 3 章 
中 讨论 概念 模型 特征 时 所 概述 的 一 样 ,需要 明确 地 引 和 人 分 支 和 迭代 ,因而 需要 额外 增加 状态 及 
迁移 。 然 而 ,由 于 大 多 数 协议 中 包含 的 操作 不 多 ,所 以 局 限 性 并 不 是 很 严重 。 

BY AP (timing diagram) 协 议 描述 常见 于 半导体 产品 的 数据 手册 中 。 在 图 8-15c 中 ,显示 
了 行为 A ALB 中 协议 的 时 序 图 描述 。 协 议 的 每 个 端口 都 在 时 序 图 中 有 一 个 对 应 的 波形 。 从 
时 序 图 中 迁移 的 相对 位 置 ,可 以 推断 出 事件 顺序 。 可 在 输入 事件 和 输出 赋值 之 间 使 用 箭头 来 
明确 地 指定 顺序 。 例 如 ,在 协议 已, 的 时 序 图 中 ,箭头 确保 了 DREQ, 在 输入 线 ARCV, 得 到 值 
“1” 之 后 才 有 效 。 事 件 之 间 的 时 延 可 以 如 协议 P; 的 时 序 图 所 示 来 规定 ,在 RD, 上 升 和 DATA， 
数据 输出 之 间 有 100ns 的 时 延 。 

时 序 图 最 大 的 优点 是 易于 理解 协议 操作 发 生 的 相对 关系 。 另 外 ,容许 在 每 对 事件 之 间 直 
接 表示 时 延 约 束 。 然 而 ,时 序 图 还 有 以 下 几 个 缺点 。 

首先 ,缺乏 “动作 ”语言 来 表示 与 数据 线 相关 的 协议 操作 。 换 名 话说 ,不 能 指定 协议 要 传送 
数据 的 精确 来 源 和 目的 地 。 例 如 ,在 图 8-15b 中 ,协议 Ps 的 状态 机 表示 读数 组 变量 Mem Var 
中 的 一 个 元 素 。 在 时 序 图 中 只 能 表示 在 某 些 时 候 数 据 线 上 读 来 的 数组 变量 的 数据 是 有 效 的 。 
同时 ,时序 图 也 不 能 和 系统 其 他 部 分 的 描述 一 起 进行 模拟 。 

其 次 ,对 重复 性 的 事件 序列 的 描述 只 能 通过 展开 循环 并 在 时 序 图 上 重复 事件 序列 的 办 法 ， 
这 将 导致 时 序 图 过 大 。 最 后 ,采用 时 序 图 表示 条 件 事 件 序列 ,需要 多 个 时 序 图 ,协议 中 的 每 个 
条 件 或 模式 都 需要 一 个 。 在 [Bor88] 中 对 上 述 一 些 问题 进行 了 讨论 ,其 中 时 序 图 被 分 解 为 一 组 
带 标 记 的 段 。 将 正则 表达 式 语法 应 用 于 有 段 标记 的 名 称 ,使 得 能 对 重复 和 和 条件 事 件 序 列 进行 描 
述 。 在 [MAP93] 中 提出 的 扩展 时 序 图 (ETD) 容 许 将 时 序 图 分 解 成 层次 化 的 和 并 发 的 于 图 。 
在 时 序 图 的 任何 层次 级 别 ,都 可 以 将 动作 附 于 事件 和 条 件 。 通 过 从 相应 的 ETD 生成 VHDL 
描述 ,协议 行为 就 成 为 可 模拟 的 。 

图 8-15d 显示 了 用 硬件 描述 语言 (HDL) 描 述 的 两 个 协议 。 表 示 实 际 被 传输 的 数据 项 的 变 
量 可 在 协议 描述 中 指定 ,这 就 容许 指定 对 诸如 在 任何 时 候 变 量 的 哪些 位 切片 被 分 配 到 数据 站 
口 ,以 及 哪些 从 数据 端口 读 人 等 的 细节 进行 描述 。 例 如 ,在 协议 已 .中 对 ADDR， 的 两 个 赋值 ， 
指定 了 协议 在 两 个 不 同 的 传输 中 ,传输 了 地 址 Addr Var 的 最 低 和 最 高 有 效 字 节 。 操 作 之 间 的 
时 延 用 时 延 语 名 来 规定 (如 VHDL 中 的 wait 语句 )。 

基于 HDL 的 协议 描述 的 主要 优点 是 完备 性 一 一 所 有 的 端口 信息 ( 端 日 名 .数目 和 类 型 )， 
重复 和 条 件 协议 操作 都 可 以 很 容易 地 使 用 HDL 的 结构 来 表示 ,不 需要 额外 的 语言 或 注释 。 其 
次 ,协议 可 以 与 系统 描述 一 起 模拟 ,不 仅 验证 数据 传输 ,而 且 验 证 整个 系统 的 功能 正确 性 。 基 
于 HDL 的 协议 描述 的 主要 缺点 是 对 事件 间 的 时 序 约束 进行 描述 非常 麻烦 。 在 ISYN 系统 
[Nes87] 中 ,将 标号 附 于 ISPS[ Bar81] 接 口 描 述 的 语句 中 。 这 些 标号 用 于 规定 接口 协议 中 相应 
操作 之 间 的 成 对 时 序 约束 。 
8.5.3 接口 进程 生成 

我 们 现在 就 阐述 生成 接口 进程 的 技术 。 接 口 进程 生成 的 输入 是 两 个 固定 协议 的 HDL fi 
述 ,详细 到 控制 线 和 数据 线 的 数量 ,以 及 在 这 些 线 上 数据 传输 的 顺序 。 输 出 是 接口 进程 的 
HDL 描述 ,以 及 两 个 协议 端口 连接 的 相关 信息 。 

我 们 将 使 用 图 8-15a 中 已 经 映射 到 标准 组 件 上 的 行为 A 和 B 来 阐明 接口 进程 的 生成 。 
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BATA BY oD de ll EYP, AP, ,其 HDL 描述 在 图 8-15d 中 给 出 。 

1. 将 协议 表示 成 有 序 关 系 

接口 进程 生成 的 第 一 步 是 将 每 两 个 协议 表示 成 一 组 有 序 关 系 。 关 系 定义 了 在 某 种 条 件 出 
现时 ,一 组 对 输出 控制 线 和 数据 线 的 赋值 ,以 及 对 输入 数据 线 的 读 人 。 条 件 可 能 是 输入 控制 线 
上 的 一 个 事件 或 者 相对 于 以 前 某 个 事件 的 固定 时 延 。 

图 8-16a 显示 了 如 何 从 协议 已 的 HDL 描述 中 得 到 这 组 有 序 关 系 。 前 两 个 赋值 语句 没有 
任何 先决 条 件 。 因 此 ,第 一 个 标志 为 A1 的 关系 ,包含 默认 为 真 的 条 件 , 同 端口 “ADDR。,” 和 和 
“ARDY,” 赋值 。 下 一 个 语句 wait until( ARCV, = “人 二) 表示 在 协议 可 以 执行 任何 操作 之 前 
必须 为 真 的 条 件 。 第 二 个 标志 为 A2 的 关系 ,就 包含 条 件 (ARCV, = ‘1’) ,接着 就 向 数据 端口 
“4DDR。 和 控制 端口 “DREQ,，” 赋 值 。 最 后 ,第 三 个 标志 为 A3 的 关系 ,包含 条 件 (DRDY, = 
‘1 ), 所 以 就 将 从 数据 端口 “DATA,” 读 来 的 数据 赋值 给 变量 DataVar”。 

类 似 地 ,可 如 图 8-16b 所 示 构 造 协 议 已 ,的 两 个 关系 。 第 一 个 标志 为 B1 的 关系 ,包含 条 件 
(RD, = “1 ) ,对 内 部 变量 MAddrVar 赋值 , MAddrVar 存储 的 是 从 端口 MADDR, 读 来 的 地 34 
址 值 。wait 语句 规定 的 100ns 时 延 表 示 后 续 操 作 的 条 件 。 因 此 ,关系 B2 包含 时 延 条 件 
(100ns) ,并 接着 向 端口 MDATA RE. 


it 


1 [ (tue 
ADDRp <= 人 var downto 0); Abin = <= drVarl7 downto 0) 
ARDYp <= '1'; T) 
wait until (ARCV A2 [( ancvo = 49: 


DREGD <= Adarvar(15 ‘sownto 8); => ADDRp <= Asarvar(1s downto 8) 
P= 


<= DREQp <= 
wait nti DRDY 1’); 
DataVar < DATAp; A3 [ (DRO 





Boar 22 DATAp ] 
a) 获得 协议 P, 的 关系 


Dp ="1 B1 [ (RDp='1 
Mat Mada = bg ene Poa: = MADDRp ] 
MDATAp. a ‘MemVar(MAddrVar); [( MDATAp <= MemVar(MAddrVar) } 


b) 获得 协议 P, 的 关系 








c) 将 两 个 协议 的 关系 划分 成 关系 组 


图 8-16 关系 的 获得 和 划分 


协议 的 关系 化 描述 的 优点 是 为 捕获 协议 中 事件 之 间 1/0 关系 提供 了 一 种 简易 的 方式 ,无 
论 协 议 是 如 何 描述 的 。 在 图 8-16a 和 图 8-16b 中 ,协议 使 用 HDL 来 描述 。 但 是 协议 也 可 以 使 
用 状态 机 或 时 序 图 来 描述 ,并 同样 可 很 容易 地 用 一 组 关系 来 表示 。 
2. 将 关系 划分 成 块 
当 且 仅 当 一 个 行为 发 送 某 特 定 大 小 的 数据 项 ,同时 另 一 个 行为 期 待 同 样 大 小 的 数据 项 时 , 
才 生 成 接口 进程 。 例 如 ,在 图 8-15a 中 ,行为 A 发 送 16 位 地 址 ,同时 行为 B WTE 16 位 地 址 。 
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只 要 行为 A 发 送 的 地 址 和 行为 B 接收 的 地 址 的 大 小 是 一 样 的 ,即使 A 是 每 次 发 送 8 位 地 址 
并 发 送 两 次 ,而 B 一 次 就 接收 16 位 也 无 所 谓 。 类 似 地 ,行为 B 向 A 发 送 从 存储 器 中 取出 的 
16 位 的 数据 项 ,也 与 行为 A 所 期 待 的 数据 大 小 一 样 。 

得 到 两 个 协议 的 关系 之 后 ,需要 将 这 两 个 协议 的 关系 进行 结 群 得 到 一 系列 的 关系 组 。 一 
个 关系 组 是 一 组 关系 的 一 个 有 序 子 集 ,表示 在 两 个 行为 之 间 进 行 数据 传输 的 单位 。 创 建 关 系 
组 的 方法 是 :一 个 协议 中 的 组 的 关系 所 产生 的 数据 大 小 应 与 另 一 一 个 协议 中 的 组 的 关系 所 产生 
的 数据 大 小 相等 。 

图 8-16c 显示 出 两 个 协议 的 关系 是 如 何 划分 成 关系 组 的 。 两 个 协议 的 关系 列 在 表 中 ,用 括号 括 
起 来 的 数字 表示 在 每 个 关系 中 操作 传输 的 位 数 。 协 议 已 的 关系 B1, 从 MADDR, 读 人 16 位 数据 。 
的 关系 列表 ,发 现 关 系 Al 和 A2 都 输出 16 位 数据 。 这 样 ,第 一 个 组 G1 就 包括 关系 A1、A2 和 

RO ieletabn orn 的 数据 依赖 性 决定 的 。 只 有 在 ALA2 P= 
sesh Fe. 才能 读 取 这 个 16 位 的 地 址 。 所 以 在 关系 组 G1 中 ,A1、A2 在 B1 之 前 : 

G1=(A1A2B1) 

关系 组 的 记号 规定 一 组 关系 A1、A2 和 B1 的 操作 执行 顺序 为 从 左 到 右 。 

以 类 似 的 方式 继续 进行 ,我 们 通过 合并 关系 A3 和 B2 创建 关系 组 G2。 由 于 关系 B2 的 操作 产 
生 的 16 位 数据 ,并 被 关系 A3 中 的 操作 接收 ,所 以 在 关系 组 G2 中 ,关系 B2 在 关系 A3 之 前 : 

G2 = (B2A3) 

3. 生成 接口 进程 

将 关系 合并 成 关系 组 之 后 ,就 可 以 生成 接口 进程 使 得 两 个 协议 兼容 。 在 关系 组 中 按照 顺 
序 排 列 的 操作 集 表示 两 个 协议 之 间 的 原子 操作 的 顺序 。 接 口 进 程 可 以 简单 地 通过 转换 关系 组 
中 的 每 个 操作 得 到 。“ 转 换 ” 一 个 原子 操作 意味 着 用 对 倡 或 者 互补 操作 来 替换 它 。 

图 8-17 对 5 个 原子 协议 操作 给 出 了 相应 的 对 偶 操 作 。 例 如 ,在 一 个 输入 控制 端口 等 待 一 
个 事件 ,C, 在 接口 进程 中 用 它 的 对 偶 操 作 表 示 , 即 对 控制 信号 Cy 的 一 个 赋值 。 向 控制 线 C, 赋 
值 的 原子 操作 ,在 接口 进程 中 有 其 对 偶 操 作 , 该 对 偶 操 作 就 是 等 待 相同 的 控制 线 来 得 到 该 赋 
值 。 协 议 向 数据 端口 赋值 表示 为 从 数据 端口 读 值 到 接口 进程 的 本 地 变量 中 。 协 议 从 数据 端口 
污 值 在 接口 进程 中 表示 为 从 内 部 变量 向 数据 端口 赋值 。 






























等 待 事件 wait until(Cp= 1’) Cp’ 1’ 
控制 线 赋值 Cp< 71’ wait until(Cp= 1’) 
读数 据 线 var<= Dp Dp<= TempVar 
数据 线 赋值 Dp< var TempVar= Dp 











wait for 100 ns 





wait for 100 ns 





固定 时 延 





图 8-17 原子 协议 操作 的 对 侦 操 作 
时 延 操作 本 身 就 是 对 偶 的 。 为 了 了 解 什么 时 候 需 要 将 时 延 操 作 添加 到 接口 进程 中 ,考虑 操作 
ol 利 o :ol 表示 一 个 协议 中 的 时 延 ,o 表 示 在 另 一 个 协议 中 等 待 一 个 在 输入 控制 线 上 的 事件 。 如 采 
同一 个 关系 组 中 os 在 oj 后 面 , 则 时 延 操 作 oi 的 对 偶 就 包含 在 接口 进程 中 。 这 就 确保 了 另 一 个 协议 
的 操作 o, 不 会 被 过 早 地 执行 。 例 如 ,关系 组 Gs 包含 关系 BA A3。 根 据 图 8- 16 中 对 关系 的 定义 ， 
可 以 发 现 关系 B, 中 的 条 件 (100 ns) 之 后 是 关系 A 中 的 等 待 条 件 (DRDY _P= 1 )。 为 了 确保 协议 
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PP 不 会 在 协议 户 输 出 数据 到 数据 线 之 前 就 读数 据 线 DATA p ,必须 在 接口 进程 中 包含 时 延 操作 。 
接口 进程 IP 是 通过 在 前 面 确定 的 关系 组 中 ,对 操作 进行 转换 得 到 的 : 
IP = (G;)(G)) 
= (A, A,B,)(BA3) 
在 以 上 关系 中 ,将 每 个 操作 用 相应 的 对 偶 操 作 代 替 , 我 们 就 能 获得 如 图 8-18a 的 接口 进 
程 。 例 如 ,考虑 关系 A, EUS TE 8- 16a 中 协议 已 的 前 两 条 语句 的 操作 


ADDRp< = AddrVar(7 downto 0); 

ARDYp< = 71’; 

A 1 是 这 两 个 操作 的 对 偶 操作 ,这 就 产生 了 如 下 语句 : 

TempVar1(7 downto 0): = ADDRp; 

wait until(ARDYp=/’1’); 

这 些 语 句 是 接口 进程 的 前 两 个 语句 ,如 图 8-18a 所 示 。 
接口 进程 






I ( G1) 7 
wait until (ARDYp = Yad 
TempVar1 (fe downto de ADDRp ; 






< 二 
wait until (D REQp = gs > 
PP downto 8) := ADDRp ; 16 







ARDYp p <= 
ARCVp MADDRe <= tempii; 
/* (group G2)’ */ RDp 
DREQp wait for 100 ns; 
DRDyp Tempvar = MDATAp ; 







DRDYp 
DATAD <= a 






接口 进程 


wait until (ARDYp = '1’); 
TempVar1 pil A downto 0) := ADDRp ; 


ARCVp <= 
wait until (DREQp = ois F 
人 5 downto 8) := ADDRp ; 


Dp 
S MADOR < = es 
wait fo 
DRDYp ba Os 





b) 互联 优化 后 的 接口 进程 
图 8-18 生成 接口 进程 

接口 进程 需要 的 任何 内 部 变量 都 在 进程 中 声明 。 两 个 协议 的 每 个 控制 线 和 数据 线 的 端口 
声明 都 加 入 到 接口 进程 中 ,并 且 方 向 取 反 (协议 的 输入 端口 在 接口 进程 中 声明 为 输出 端口 , 反 
之 亦 然 )。 最 后 ,两 个 行为 的 控制 和 数据 端口 与 接口 进程 中 的 相应 端口 连接 。 

4. 互联 优化 

前 面 的 步骤 生成 的 接口 进程 要 求 两 个 协议 的 数据 线 和 控制 线 都 连接 到 接口 上 ,如 图 8-18a 
所 示 。 在 一 些 情 况 中 ,可 将 两 个 通信 行为 的 某 些 控制 和 数据 端口 直接 连接 在 一 起 ,有 效 地 避 开 
了 接口 进程 。 这 样 做 有 以 下 两 个 优点 :首先 ,通过 减少 系统 中 的 线 网 数量 简化 了 系统 的 互联 关 
系 。 其 次 ,在 接口 过 程 中 和 这 些 端口 相关 的 操作 可 以 完全 删除 。 这 样 , 当 进 行 逻辑 综合 时 ,将 
产生 一 个 更 有 效 的 接口 进程 ,面积 更 小 并 且 性 能 更 好 。 
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第 一 种 互联 优化 试图 要 做 的 是 减少 连接 到 接口 进程 的 数据 线 。 假 设 两 个 数据 端口 Di 和 
站 ,大 小 相同 并 属于 两 个 协议 。 如 果 接 口 进程 每 次 从 端口 D: 读 到 数据 都 与 到 端口 Di ,并 且 
在 两 个 操作 之 间 没 有 时 延 (wait 语句 ) ,那么 两 个 协议 的 数据 端口 就 可 以 直接 连接 。 所 有 向 端 
口 D1 的 写 入 和 从 端口 D; 的 读 出 都 可 从 接口 进程 中 删除 。 因 此 ,临时 生成 的 用 于 保存 站 口 间 
传输 值 的 变量 就 可 以 删除 。 在 图 8- 18a 中 ,端口 MDATAp 和 DATAzp 的 大 小 都 是 16 位 ,从 读 
MDATA, 的 数据 到 向 DATA, 写 数 据 没有 时 延 。 这 些 端 口 就 可 以 直接 连接 。 此 外 ,临时 变量 
TempVar2 和 接口 进程 中 对 这 些 端口 读 写 的 语句 都 可 以 删除 。 

第 二 种 优化 检查 两 个 协议 的 控制 端口 。 考 虑 两 个 内 议 的 控制 端口 Cl 和 C2。 如 末 每 当 
接口 进程 从 Cl 得 到 -一 个 特定 的 值 ,就 将 C2 更 新 为 这 个 值 , 则 Cl 和 C2 可 以 直接 连接 。 例 
如 ,在 图 8-18a 中 ,协议 已 AIP, 的 控制 端口 DREQp 和 RDp 可 以 直接 连接 。 相 应 的 等 待 和 赋 
值 语 名 可 从 接口 进程 中 删除 . 

为 协议 已 ALP, 生成 的 优化 接口 进程 如 图 8-18b 所 示 。 数 据 端 口 MDATA, 和 DATA,， 
控制 端口 DREQ, 和 RD, ,都 直接 连接 。 

算法 8.5.1: 生 成 接口 进程 

/* 为 每 个 协议 生成 关系 * 7 

R, = CreateRelations( P, ) 


R, = CreateRelations( P; ) 








/* 将 关系 划分 成 关系 组 G*/ 
G = GroupRelations( R,,, R, ) 


/x 对 每 个 关系 组 G 中 的 操作 ,在 接口 进程 中 加 入 其 对 偶 操 作 的 语句 * / 
for each relation group G;© G loop 
for each relation R; © G; loop 
for each atomic operation o} © R; loop 
AddDualStatement( IP, 0, ) 
_ end loop 
end loop 


end loop 


CreateAndOptimizePorts( IP, P,, Pa) 


5. 评估 接口 进程 生成 

算法 8.5.1 总 结 了 接口 进程 生成 的 步 又 。 给 定 协议 的 HDL 描述 , CreateRelations 生成 表 
示 该 协议 的 关系 集合 。GroupRelations 将 集合 R, AR, 划分 成 关系 组 ,以 集合 G 表示 。 对 于 
关系 组 中 按照 顺序 排列 的 每 个 原子 操作 ,过程 AddDualStatement 按照 图 8-17 所 定义 的 ,次 
加 相应 的 对 偶 语 名 到 接口 进程 IP 中 。 一 旦 接口 进程 的 语句 生成 之 后 , CreateAndOp- 
timizePorts 就 在 两 个 协议 和 接口 进程 之 间 生 成 一 组 端口 ,如 可 能 还 进行 优化 。 

本 节 介 绍 的 技术 的 主要 优点 是 可 以 在 任何 可 用 顺序 HDL 语句 表示 的 两 个 协议 之 加 创建 
接口 。 所 生成 的 接口 进程 可 与 系统 描述 的 其 他 部 分 一 起 进行 模拟 ,以 验证 在 将 一 组 功能 对 象 
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绑 定 到 标准 组 件 后 系统 的 功能 。 该 方法 是 通用 的 ,因为 它 能 为 支持 两 个 不 同 数据 端口 宽度 的 
协议 建立 接口 。 该 方法 支持 的 时 序 信息 表现 为 协议 操作 之 间 非 重合 时 延 。 但 是 ,由 于 只 生成 
了 接口 的 HDL 描述 ,不 支持 事件 之 间 的 最 小 和 最 大 时 延 约 束 。 这 些 约束 可 传递 到 综合 工具 ， 
完成 对 接口 进程 的 硬件 综合 . 


8.5.4 协议 兼容 的 其 他 方法 

这 里 介绍 解决 标准 组 件 之 间 的 协议 兼容 问题 的 其 他 三 种 方法 。 

1. RBS 

定制 芯片 和 系统 总 线 之 间 的 接口 转换 器 的 综合 方法 在 [1BK87, Bor88j 中 讨论 。 转 换 器 
(transducer) 定 义 为 连接 两 个 电路 块 的 粘连 逻辑 。 两 个 不 兼容 接口 的 时 序 图 作为 输入 。 输 出 
是 转换 拜 电路 的 逻辑 描述 。 

我 们 以 图 8-19 中 FIFO 栈 控制 单元 [ Bor88 ] 为 例 ,来 说 明 如 何 从 时 序 图 对 逻辑 电路 进行 综 
合 。 该 单元 有 两 个 输入 和 三 个 输出 ,如 图 8-19a 所 示 。 栈 控制 单元 按 异 步 操作 , 即 没有 外 部 时 
钟 来 同步 单元 内 的 操作 。 


R: Ro 
i _ , 
Ao 单元 Al 
L 


a) FIFO 堆 栈 控制 单元 





d) AR 
图 8-19 ”从 时 序 图 综合 
图 8-19b 显示 了 单元 输入 和 输出 相关 的 时 序 图 。 虚 线 箭头 表示 单元 中 各 种 事件 之 间 的 有 序 
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约束 。 第 一 步 从 时 序 图 生成 事件 图 。 对 于 时 序 图 中 的 每 个 事件 ,如 上 升 和 下 降 的 跳 变 , 都 在 事件 
图 中 对 应 一 个 结 点 。 事 件 图 中 结 点 间 的 强 线 表示 时 序 图 中 相应 事件 之 间 的 顺 友 或 者 最 小 和 最 大 
的 时 延 约束 。 图 8-19c 显示 出 为 图 8-19b 中 时 序 图 所 构造 的 事件 图 。 例 如 ,对 时 序 图 中 输出 工 的 
每 个 上 升 和 下 降 沿 的 跳 变 ,在 事件 图 中 就 有 相应 的 结 点 ,分 别 标记 为 工人 和 工 yY 。 由 于 工 的 第 


一 个 上 升 沿 是 Ri 的 上 升 沿 触发 引起 的 ,所 以 在 事件 图 中 从 Ri 个 到 二 个 加 一 条 弧 线 。 


一 旦 生成 了 事件 图 ,就 采用 模板 匹配 策略 来 为 单元 产生 的 每 个 输出 生成 骨架 电路 。 事 件 
图 中 的 每 个 结 点 都 用 一 个 模板 电路 实现 ,在 输出 产生 正确 的 跳 变 。 综 合 方法 可 采用 三 种 不 同 
类 型 的 模板 以 反映 要 生成 的 各 种 事件 :一 种 用 于 生成 异步 事件 ,一 种 用 于 从 其 他 同步 事件 生成 
同步 事件 ,一 种 用 于 从 异步 事件 生成 同步 事件 。 每 种 模板 都 包含 一 个 SR 锁 存 嚣 。 上 升 和 下 
降 跳 变 是 通过 置 位 和 复位 SR 锁 存 器 来 完成 的 。 图 8-19d 显示 出 如 何 从 图 8-19c Bras A SB 
图 中 为 三 个 输出 上 、Ro .Ai 中 的 每 一 个 构造 骨架 电路 。 以 单元 输出 工 为 例 。L 的 第 一 个 上 升 
沿 跳 变 是 三 个 条 件 引 发 的 :输入 Ao 为 低 , 输 入 Ri 为 上 升 沿 , 工 为 低 。 这 样 ,L 的 SR MA ae 
在 AoRiL 为 真 时 置 位 。 这 用 一 个 与 门 来 实现 ,该 与 门 驱动 锁 存 器 的 输入 S 以 得 到 输出 L。 最 
后 一 步 是 应 用 逻辑 优化 技术 使 生成 的 骨架 电路 最 小 化 。 

在 图 8-19 的 例子 中 ,逻辑 电路 是 从 单独 的 时 序 图 得 到 的 。 为 了 综合 转换 器 ,首先 从 两 个 
接口 的 时 序 图 生成 分 开 的 事件 图 。 接 着 将 两 个 事件 图 合并 成 一 个 事件 图 ,采用 的 方法 是 :或 者 
明确 地 规定 连接 两 个 事件 图 中 结 点 的 合并 标号 ,或 者 通过 考察 两 个 接口 之 间 的 数据 依赖 性 。 
然后 ,将 上 面 介绍 的 模板 策略 应 用 于 合并 后 的 事件 图 以 生成 骨架 电路 。 接 着 ,不同 输 出 信号 的 
锁 存 器 通过 对 事件 图 进行 宽度 优先 遍历 的 方法 实现 互联 。 通 过 添加 适当 的 逻辑 电路 ,可 矫正 
任何 违反 时 序 约束 和 存在 竞争 条 件 等 问题 。 例 如 ,通过 在 电路 中 插入 时 延 单元 以 满足 最 小 时 
序 约束 。 最 后 ,对 所 产生 的 电路 进行 优化 。 

转换 器 综合 方法 的 主要 优势 是 结合 了 两 个 接口 中 事件 之 间 详 细 的 时 序 约束 。 其 次 ,与 前 
一 节 介绍 的 接口 进程 生成 方法 不 同 ,转换 器 综合 的 输出 是 一 个 逻辑 电路 ,也 就 不 需要 进一步 的 
综合 。 该 方法 的 一 个 局 限 性 是 不 容许 两 个 接口 的 数据 宽度 不 匹配 。 此 外 ,所 产生 的 转换 器 电 
路 不 能 和 它 所 连接 的 协议 时 序 图 一 起 模拟 。 

2. 协议 转换 

协议 转换 器 是 - -个 行为 , 它 使 得 两 个 协议 的 控制 信号 匹配 ,使 得 两 者 之 间 可 以 进行 数据 传 
输 。 协 议 转 换 器 的 综合 方法 在 [AM 91，Ake91] 中 讨论 。 要 建立 接口 的 协议 用 基于 Verilog 的 
有 限 状 态 机 来 描述 。 将 两 个 状态 机 进行 叉 积 并 优化 就 得 到 转换 器 的 状态 机 描述 。 该 方法 可 能 
导致 协议 转换 器 有 非常 多 的 状态 。 协 议 转 换 需 要 假设 转换 器 中 的 数据 通路 是 给 定 的 ,因此 ,与 
上 面 介 绍 的 转换 器 综合 方法 一 样 , 该 方法 也 不 支持 数据 宽度 的 不 匹配 。 

3. 系统 接口 模块 

在 [SB92] 中 提出 一 种 用 于 SIERA 设计 环境 的 系统 接口 模块 的 设计 方法 。SIERA 
[SSB91] 通 过 提供 一 个 包含 详细 1/O 结构 和 协议 (用 事件 图 描述 ) 的 模块 库 , 以 寻求 设计 工作 
量 的 最 小 化 。 协 议 的 细节 在 库 中 以 事件 图 的 形式 表示 ,对 系统 设计 者 是 不 可 见 的 。 模 块 之 则 
的 通信 被 抽象 为 一 个 层次 ,在 该 层次 上 ,设计 者 只 需要 从 库 中 实例 化 适当 的 一 些 系 统 模块 ,用 
源 端 口 和 目标 端口 互联 的 方式 规定 这 些 模块 的 相互 作用 ,采用 专用 语言 IDL 的 高 级 元 语 
(high-level primitive) EH 述 。 、 

一 个 接口 模块 包含 一 个 协议 控制 器 和 一 个 接口 控制 他 。 协议 控制 器 对 在 单个 传输 中 两 个 
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协议 的 控制 信号 建立 接口 。 接 口 控制 希 在 两 组 数据 线 之 间 配 置 互联 ,并 指导 协议 控制 器 对 协 
议 之 间 的 握 于 事件 建立 接口 。 

首先 ,从 用 户 对 模块 互联 的 描述 中 构造 控制 流 图 。 将 调度 和 分 配 应 用 于 控制 流 图 产生 接 
口 控制 种 ,以 及 一 个 数据 通道 用 以 实现 两 个 协议 数据 线 之 间 的 数据 传输 。 其 次 ,从 模块 库 获 得 
两 个 协议 的 事件 图 ,并 在 基于 两 个 协议 中 操作 之 间 的 数据 依赖 关系 的 基础 上 将 两 个 事件 图 互 
联 。 从 这 个 事件 图 中 可 综合 出 协议 控制 化, 啊 应 两 个 模块 协议 的 控制 信号 。 

这 种 方法 的 主要 优势 是 将 设计 肴 从 考虑 底层 细节 的 负担 中 解放 出 来 ,因为 诸如 1O 控制 
言 号 和 时 延 约 束 等 这 些 信 息 都 被 存储 在 模块 库 中 。 设 计 者 只 需要 用 IDL 语言 对 高 层次 数据 
传输 进行 描述 。 虽 然 两 个 具有 不 同 数据 宽度 的 协议 是 可 以 接口 的 ,但 设计 者 需要 明确 规定 两 
组 数据 线 互 联 和 多 路 选择 ,这 些 数据 线 要 在 接口 模块 中 实现 。 该 方法 的 另 一 个 局 限 性 是 综合 
后 的 接口 模块 不 能 与 原始 协议 一 起 模拟 。 
8.6 细 化 软件 /硬件 接口 

任何 行为 描述 都 是 既 可 以 用 软件 实现 也 可 以 用 硬件 实现 的 。 如 有 果 我 们 选择 用 软件 实现 ， 
“行为 描述 就 被 编译 到 选 定 处 理 器 指令 集 ; 另 一 方面 ,如 果 我 们 决定 用 定制 硬件 来 实现 行为 描 
述 ,就 必须 将 描述 综合 成 组 件 结构 ,其 中 的 组 件 取 自 于 给 定 库 。 这 些 组 件 可 能 是 成 品 ,也 可 用 
组 件 生成 器 生成 。 重 要 的 是 任何 包含 软件 组 件 和 使 件 组 件 的 系统 都 需要 一 个 便 件 - 软件 接口 
来 实现 不 同 部 分 之 间 的 通信 。 


总 线 





图 8-20 ”一 种 软 硬 件 系统 体系 结构 


在 图 8-20 的 系统 中 ,处理 器 和 存储 器 是 软件 组 件 ,其 他 是 硬件 组 件 。 这 些 硬 件 组 件 和 软件 
组 件 用 总 线 连接 ,这 意味 着 每 个 组 件 要 么 是 总 线 主 端 (bus master) ,要 么 是 总 线 从 端 (bus slave)。 
总 线 主 端 是 任何 能 控制 总 线 .发 起 数据 传输 的 组 件 ,如 :处 理 器 、 硬 盘 控制 器 .DMIA 控制 器 。 相 对 
地 ,总 线 从 端 是 任何 能 响应 总 线 主 端 发 出 的 命令 ,但 不 发 起 总 线 传输 的 组 件 。 典 型 的 总 线 从 端 是 
存储 器 和 LO 组件 。 对 于 专用 集成 电路 ,按照 其 执行 的 特定 功能 , 既 可 能 是 总 线 主 病 也 可 能 是 总 
线 从 端 。 例 如 ,一 个 浮 点 协 处 理 器 一 般 作 为 总 线 从 端 实现 ,在 协 处 理 器 中 具有 输入 和 输出 缓冲 顺 
来 存储 操作 数 和 结果 。 另 一 方面 ,一 个 用 于 捕获 视频 帧 的 专用 集成 电路 一 般 实 现 为 总 线 主 端 , 因 
为 这 是 获得 高 速 存 储 器 数据 传输 的 最 好 方式 。 注 意 , 当 两 个 以 上 的 总 线 主 端 连 接 到 一 个 总 线 上 
时 ,我 们 就 需要 一 个 总 线 仲裁 器 来 确保 任何 时 候 都 只 有 一 个 总 线 主 端 控制 总 线 。 大 多 数 和 总线 ,如 
VMEbus 或 者 Multibus, 都 在 其 协议 中 结合 了 总 线 仲裁 方案 。 而 另 一 些 依赖 处 理 器 的 总 线 ,如 
PC/XT/AT 等 ,都 是 由 处 理 器 对 总 线 控 制 的 并 发 请 求 进行 仲裁 。 

总 线 自身 作为 一 个 互联 组 件 ,可 为 特定 应 用 而 设计 ,如 8.3.3 节 中 所 述 ,或 者 也 可 以 从 预 
先 确定 好 的 总 线 集中 选择 ,包括 Multibus, VMEbus.NuBus,PC/XT/AT bus、STDbus 等 。 由 于 
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每 种 总 线 都 有 有 自己 的 遂 信 协议 ,任何 连接 到 总 线 的 组 件 都 必须 遵守 该 总 线 的 协议 。 如 8.5 T 
中 介绍 的 , 当 某 成 品 组 件 的 通信 协议 与 选 定 总 线 的 协议 不 匹配 时 ,我 们 就 遇 到 了 问题 ,此 时 为 
确保 正确 通信 ,设计 者 需要 设计 接口 组 件 。 注 意 ,如 来 专用 集成 电路 还 没有 实现 , 选 定 总 线 的 
协议 可 以 集成 在 专用 集成 电路 的 功能 中 来 解决 接口 问题 。 

下 面 我 们 将 讨论 大 二 与 硬件 组 件 和 软件 组 件 之 间接 口 相关 的 一 些 任 务 。 例 如 ,变量 分 配 
过 程 可 将 变量 分 配 到 软件 或 硬件 中 ,在 最 小 成 本 下 满足 数据 传输 速率 要 求 。 接 口 生成 的 任务 
是 添加 一 个 接口 进程 ,使 得 组 件 能 与 不 兼容 总 线 之 间 正 确 通信 。 最 后 ,数据 和 控制 访问 细 化 的 
任务 是 将 数据 或 者 控制 传输 需要 的 通信 协议 插入 到 软件 和 硬件 描述 中 。 


8.6.1 目标 体系 结构 

为 解释 软 / 人 硬件 接口 问题 ,我 们 以 图 8-20 所 示 的 体系 结构 为 例 。 该 体系 结构 非常 简单 ,只 
包含 一 个 处 理 器 和 几 个 专用 集成 电路 。 我 们 只 使 用 一 个 处 理 器 的 原因 是 为 了 使 软 / 硬 件 接 口 
的 细 化 更 易于 解释 。 更 复杂 的 体系 结构 就 需要 考虑 处 理 器 间 通 信 的 同步 和 存储 器 保护 的 问 
题 ,这 已 超出 了 本 书 的 范围 。 | | 

通常 ,我 们 从 一 个 划分 描述 开始 软 / 硬 件 接口 的 细 
化 工作 ,如 图 8-21 所 示 。 在 这 个 描述 中 ,wl 一 v6 RANE 
量 , B1- B4 表示 行为 ,p11 一 p3 表示 端口 。 图 中 的 边 表 
示 行 为 对 变量 或 者 端口 的 数据 访问 。 映 射 到 软件 部 分 
的 行为 称 为 软件 行为 ,类 似 地 ,映射 到 硬件 部 分 的 行为 
称 为 硬件 行为 。 在 本 例 中 , BL 和 B2 是 软件 行为 ,而 
B3 和 B4 是 硬件 行为 。 软 件 变 量 或 软件 端口 定义 为 只 
能 由 软件 行为 访问 的 变量 或 端口 。 例 如 , v1 是 软件 变 82A 一 个 被 划 分 的 系统 描述 
量 , pl 是 软件 端口 ;类 似 地 ,只 能 由 硬件 行为 访问 的 变量 或 端口 称 为 硬件 变量 或 硬件 端口 。 在 本 
例 中 ,v3、v5 和 v6 是 硬件 变量 ,p3 是 硬件 端口 。 最 后 , 既 能 被 软件 行为 访问 也 能 被 便 件 行为 访 
问 的 变量 或 端口 称 为 共享 变量 或 共享 端口 ,如 v2、v4 为 共 掌 变量 , p2 为 共享 端口 。 


8.6.2 变量 分 配 

变量 分 配 的 过 程 就 是 将 描述 中 的 变量 分 配给 软件 或 者 硬件 ,也 就 是 分 配给 存储 器 或 者 专 
用 集成 电路 。 通 常 ,所 有 软件 变量 将 分 配给 存储 器 ,因为 存储 器 一 般 足 够 大 来 容纳 它们 。 我 们 
也 可 以 将 软件 变量 分 配给 专用 集成 电路 的 存储 器 ,但 是 没有 任何 好 处 , 平 白 增 大 了 专用 集成 电 
路 成 本 。 对 于 硬件 变量 ,也 倾向 于 分 配给 存储 器 ,以 适应 专用 集成 电路 芯片 有 限 的 尺寸 ,但 我 
们 必须 认识 到 这 种 分 配 会 增加 总 线 通信 量 和 降低 专用 集成 电路 的 速度 ,其 原因 是 专用 集成 电 
路 可 能 会 遭遇 到 与 处 理 器 的 存储 器 访问 竞争 。 当 专用 集成 电路 频繁 访问 这 些 变量 的 时 ,这 种 
考虑 尤其 关键 。 我 们 还 应 意识 到 ,任何 共享 变量 是 分 配 到 存储 器 中 还 是 分 配 到 专用 集成 电路 
的 存储 器 中 ,存在 着 类 似 于 性 能 和 成 本 的 折 中 问题 。 

图 8-22 显示 出 三 种 可 选择 的 变量 分 配方 法 。 在 这 个 例子 中 ,行为 A 在 一 个 处 理 器 上 的 
行 ,行为 Bl 和 B2 被 综合 到 专用 集成 电路 中 。 需 要 注意 的 是 行为 A ABI 都 访问 共享 变量 
v1 ,相应 变量 访问 的 通信 通道 分 别 是 X 和 Y1。 还 需要 注意 的 是 变量 v2 只 通过 通道 Y2 被 
B2 访问 。 这 三 种 变量 分 配方 法 的 区 别 如 下 :图 8-22a 中 的 硬件 变量 和 共享 变量 都 分 配给 存储 
器 ;图 8-22b 中 只 有 共享 变量 分 配给 存储 器 ,而 硬件 变量 分 配给 专用 集成 电路 ;图 8-22c 中 变量 
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a) 硬件 变量 和 共享 变 b) 硬件 变量 在 ASIC 中 ， c) 硬件 变量 和 共享 
量 都 在 存储 器 中 共享 变量 在 存储 器 中 变量 都 在 ASIC 中 


图 8-22 变量 分 配 

假设 通道 XX、Y1 和 Y2 的 平均 速率 分 别 为 avgrate (六)、avgrate(Y1) 和 和 avgrate( Y2), 那 
么 在 图 8-22a、b 和 < 情况 中 ,所 需 总 线 传 输 速 率 分 别 为 avgrate( X ) + avgrate( Y1) + avgrate 
(Y2) avgrate( X) + avgrate( Y1)#ll aosgrate(X)。 对 不 同 的 变量 分 配 ,我 们 可 以 确定 其 相对 
成 本 :图 8-22b 计 算 为 cosi (zz2) ,图 8-22c 计算 为 cost (wl) + cost (v2) ,其 中 cosz(z) 表 示 在 专 
用 集成 电路 中 实现 变量 o 所 需要 的 硅 材料 成 本 。 注 意 ,由 于 ol 需要 双 端 口 , 所 以 cost Cul K 
于 cost (v2)。 

从 例子 中 可 以 看 出 ,降低 总 线 传输 速率 的 最 好 方法 是 将 全 部 的 硬件 变量 和 共 诗 变量 都 分 
配给 专用 集成 电路 。 另 一 方面 ,这 样 的 变量 分 配 将 是 昂贵 的 ,因为 专用 集成 电路 的 成 本 远大 于 
标准 组 件 的 成 本 。 图 8-22 显示 出 需要 把 总 线 传输 速率 从 情况 a 降低 到 情况 c ,付出 额外 的 硅 
材料 的 成 本 。 我 们 称 这 些 额 外 硅 材 料 的 成 本 为 变量 一 访问 成 本 。 

上 面 提 到 ,为 了 将 软件 和 硬件 建立 接口 ,我 们 必须 选择 一 个 总 线 以 使 得 独立 的 软件 组 件 和 
硬件 组 件 可 以 通信 。 为 了 选择 总 线 ,我 们 还 必须 考虑 所 需 总 线 的 传输 速率 和 总 线 戌 本 ,总线 成 
本 包括 总 线 本 身 的 成 本 及 其 接口 组 件 的 成 本 。 如 果 组 件 协 议 与 总 线 协议 匹配 ,那么 接口 成 本 
为 0。 另 一 方面 ,如 果 能 使 用 成 品 的 接口 电路 来 连接 不 相 容 的 组 件 到 总 线 , 那 么 接口 成 本 就 等 
于 接口 电路 的 成 本 。 最 后 ,如果 得 不 到 这 样 的 接口 电路 ,那么 接口 的 成 本 将 是 很 高 的 ,因为 必 
须 为 接口 综合 出 一 个 定制 的 专用 集成 电路 。 

我 们 应 意识 到 ,总 线 选择 和 变量 分 配 是 互相 关联 的 。 例 如 ,对 于 一 个 给 定 的 总 线 , 变 量 分 
配 的 目的 就 是 寻找 那 种 满足 总 线 传输 速率 同时 又 使 变量 一 访问 成 本 最 小 化 的 分 配方 案 。 类 似 
地 ,对 于 一 个 给 定 的 变量 分 配方 案 ,总 线 选择 的 过 程 就 涉及 选取 满足 所 要 求 传输 速率 且 成 本 最 
小 的 总 线 。 在 大 多 数 情况 下 ,由 于 我 们 需要 以 最 低 系 统 成 本 满足 数据 传输 速率 的 一 个 解决 方 
案 , 因 此 要 统筹 考虑 总 线 选 择 和 变量 分 配 。 

在 算法 8.6.1 给 出 一 个 可 用 于 并 发 总 线 选 择 和 变量 分 配 的 算法 。 直 观 来 看 ,算法 检查 一 
组 可 能 的 总 线 S, ,S 可 由 设计 者 提供 ,或 者 存 于 一 个 包含 了 所 有 可 用 总 线 的 库 中 。 对 每 个 属 
于 S; 的 总 线 B, 我 们 要 对 一 组 变量 S$, 考 虑 每 种 可 能 的 变量 分 配 D,S, 包 含 的 要 么 是 划分 后 系 
统 描述 中 给 出 的 所 有 的 硬件 变量 和 共享 变量 ,要 么 只 是 设计 者 在 这 些 变 量 中 选 出 的 一 个 子 集 。 
注意 , S, 不 包含 软件 变量 ,因为 所 有 软件 变量 应 自动 分 配给 存储 妖 。 

算法 8.6.1: 变 量 分 配 


Determine S,/* 总 线 集合 */ 
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Determine S,/* 变量 集合 */ 


mincost = CC 
mincost _ bus = unknown 


mincost _ var _ dist = unknown 


for each BE S; loop 
for each D of S, loop 
datarate(D,B) = 2. ¢ mapped o p avgrate( C) 
if( datarate( D, B)<rate( B) )then 
currcost = Cost ( B) + Cost ( D) 
if( currcost < mincost ) then 
mincost = currcost 
mincost _ bus = B 
mincost _ var _ dist = D 
end if 
end if 
end loop 


end loop 


if( mincost = œ) 

then return( failure ) 

else return(mincost _ bus, mincost _ var _ dist) 
end if 


Xt AAR A D, RBI RT Be B 的 所 有 通道 C 的 平均 速率 avgrate(C ) 的 
总 和 (avgrate(C) 的 定义 见 7.2.3 节 ), 就 能 确定 所 选 总 线 B 上 所 需 的 数据 传输 速率 ,表示 为 
datarate(D,B)。 这 样 , 我 们 就 能 确定 给 定 总 线 B 的 传输 速率 rate(B) 是 否 满 足 特定 配置 所 
需 的 数据 传输 速率 。 该 算法 会 返回 满足 所 需 数据 传输 速率 并 且 成 本 最 小 的 配置 方案 。 成 本 包 
括 总 线 成 本 Cost (B) 和 变量 一 访问 成 本 Cost (DD)。 注 意 :临时 变量 mincost . mincost _ bus 
mincost _ var _dist 被 用 来 记录 迄今 找到 的 最 优 配置 方案 。 

算法 复杂 度 为 O(N x M) ,其 中 N 是 总 线 数量 , M 是 要 检查 的 变量 分 配方 案 数量 。 尤 其 
需要 注意 ,由 于 rate(B) 通 常 作为 总 线 B 的 峰值 速率 给 出 ,算法 应 将 datarate(D,B) 计 算 为 所 
有 通道 C 的 峰值 速率 的 总 和 peakrate(C),C 为 映射 到 总 线 B 的 所 有 通道 (zea&rate(C) 的 定 
义 见 7.2.3 节 )。 然 而 ,在 很 多 情况 下 ,采用 通道 峰值 速率 计算 过 于 保守 ,可 能 导致 对 总 线 的 低 
效 使 用 ,因为 在 大 部 分 时 间 ,通道 不 大 可 能 以 峰值 速率 传输 数据 。 要 选择 peakrate(C) 而 不 是 
angrate(C) 来 计算 datarate (D,B), 就 需要 对 数据 传输 情况 进行 剖析 。 


8.6.3 接口 生成 

如 前 所 述 ,设计 者 有 时 候 遇 到 这 样 一 种 情况 , 即 所 选 总 线 和 所 选 组 件 的 通信 协议 之 间 不 碌 
容 , 并 且 没 有 成 品 的 接口 组 件 可 以 使 用 。 在 这 些 情况 下 ,需要 使 用 一 个 类 似 于 8.5 节 中 讨论 的 
进程 生成 一 个 接口 ,用 以 进行 协议 转换 。 在 8.5 节 中 ,我们 提出 了 一 种 在 两 个 不 兼容 组 件 之 间 
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生成 接口 的 技术 ,包含 以 下 步骤 :(1) 将 要 建立 接口 的 组 件 协议 表示 成 有 序 关 系 ;(2) 将 这 些 


关系 划分 成 关系 组 ;(3) 通过 将 关系 组 中 的 每 个 操作 转化 为 对 偶 操作 来 生成 接口 的 描述 。 

在 组 件 和 总 线 之 间 生 成 接口 的 技术 与 两 个 
组 件 之 间 生 成 接口 的 技术 相似 ,只 有 一 个 微小 
差别 。 我 们 使 用 图 8-23 的 例子 来 说 明 这 个 差 
别 。 假 设 图 8-23a 中 的 组 件 A 使 用 它 的 协议 
向 组 件 B 发 送 数 据 , 组 件 B 使 用 自己 的 协议 接 
收 数据 。 两 者 之 间 的 接口 为 了 适应 A AB 的 
协议 的 不 兼容 性 ,按照 与 A 匹配 的 协议 接收 来 
AA 数据 ,然后 按照 与 B 匹配 的 协议 向 B RIK 9 APC D) 一 个 组 件 和 一 个 总 线 之 间 
数据 。 如 在 8.5.3 节 中 介绍 的 ,这 些 在 接口 中 图 8-23 接口 
匹配 的 协议 将 由 与 A 和 B 中 操作 对 偶 的 操作 
组 成 。 在 图 8-23b 中 ,我 们 需要 的 是 组 件 A 和 总 线 之 间 的 接口 ,该 接口 按照 与 组 件 A 匹配 的 
协议 接收 来 自 A 的 数据 ,然后 与 总 线 相同 的 协议 将 数据 发 送 到 总 线 上 。 类 似 地 ,我 们 在 总 线 
和 组 件 B 之 间 也 需要 一 个 接口 ,该 接口 按照 总 线 的 协议 接收 数据 ,然后 按照 与 组 件 B 匹配 的 
协议 向 B 发 送 数据 。 需 要 注意 的 是 ,如 果 需 要 一 个 接口 ,使 用 与 某 组 件 匹 配 的 协议 ,该 接口 就 
包含 与 组 件 协 议 操作 对 偶 的 操作 。 另 一 方面 ,如 果 需 要 一 个 接口 ,使 用 与 某 组 件 相 同 的 协议 ， 
该 接口 就 包含 与 组 件 协议 操作 完全 相同 的 操作 。 因 此 ,总 线 和 组 件 之 间 的 接口 要 包含 那些 与 
组 件 的 协议 操作 对 偶 的 操作 ,也 要 包含 与 总 线 协 议 操作 相同 的 操作 。 

图 8-24 是 一 个 接口 实例 ,该 接口 实现 了 组 件 连 接 到 总 线 的 组 件 的 读 操 作 ,该 总 线 是 VME 
总 线 的 简化 版 本 。 可 以 看 到 如 图 8-24d 中 所 示 的 接口 ,包含 了 组 件 协 议 操 作 的 对 偶 操 作 ,以 及 
与 总 线 协议 操作 相同 的 操作 (着 重 显示 部 分 )。 注 意 信 号 AS 的 星 号 表示 AS 是 低 电 平 有 效 
的 。 协 议 生 成 的 详细 内 容 已 经 在 8.5.3 节 中 讨论 到 了 。 


8.6.4 数据 访问 细 化 

当 我 们 将 行为 和 它 访问 的 变量 分 配 到 不 同 划分 部 分 的 时 候 , 由 于 变量 定义 已 被 从 行为 中 移 
动 出 来 ,我 们 就 需要 对 描述 中 的 变量 访问 进行 细 化 。 返 回 到 图 8-21 中 的 描述 ,假设 在 变量 分 配 
之 后 ,共享 变量 v2 和 硬件 变量 v5 被 分 配给 存储 器 , 而 共享 变量 v4 被 分 配给 专用 集成 电路 的 双 
端口 缓冲 器 ,如 图 8-25 所 示 。 在 同一 个 划分 部 分 中 的 数据 访问 并 不 是 问题 ,因为 它们 或 者 如 图 
8-25 中 的 v1 那样 由 软件 编译 照顾 到 ,或 者 如 v3 和 v6 那样 由 硬件 综合 工具 来 处 理 。 因 此 ,数据 
访问 细 化 的 任务 是 要 对 跨越 不 同 划分 部 分 的 数据 访问 进行 细 化 ,如 :v2、v4 和 v5 的 情况 。 

在 图 8-25 中 ,存储 器 或 专用 集成 电路 缓冲 器 中 的 每 个 位 置 都 在 全 局 地 址 空间 中 有 一 个 唯一 
的 地 址 ,该 地 址 对 任何 总 线 主 端 都 是 可 见 的 。 由 于 通常 处 理 器 的 引 肢 数 是 固定 的 ,没有 额外 引 肚 
供 端 口 使 用 ,所 以 软件 行为 访问 的 端口 必须 映射 到 全 局 地 址 空间 中 ,并 通过 处 理 器 的 总 线 访问 。 
所 以 ,软件 行为 的 端口 访问 也 需要 细 化 。 注 意 ,硬件 行为 的 端口 访问 不 需要 细 化 ,这 是 由 于 专用 
集成 电路 可 为 端口 提供 引 脚 。 在 图 8-25 中 ,虚线 框 中 部 分 的 数据 访问 通道 都 需要 细 化 。 

数据 访问 有 四 种 基本 类 型 : 

1) 软件 行为 访问 存储 器 :该 类 型 的 数据 访问 通过 处 理 器 的 取 / 存 指令 完成 。 在 图 8-25 
中 ,B2 对 zz2 的 访问 属于 这 种 类 型 。 
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HIFA: 
At [ (true 
ADDRp <= AddrVar(31 downto O); (ust GRp <= AddrVar{31 downto 0) 


wait UPt (DRDYp = "1; —> DREQp 一 1 } 
DataVar(31 downto 0) <= DATAp; A2 [ (DROVE = "19 : 
DataVar(31 downto 0) <= DATAp ] 





a) 组 件 协议 的 关系 


B1 [ (true) : 
put address on ADDA 


B2 [ (DTACK* = 
ata aon DATA is ready 





b) 总 线 协议 的 关系 


TempVart (32 0) := ; 
walt until (GREG a= ADDRp 


ADDR =a TempVart; 


wait until (DTACK* =’0"); 
par varatse downto 0): = DATA; 


DRD 
DATAS <= T Tempar: 





d) 生成 的 接口 
图 8-24 HIF- AkO 


2) 硬件 行为 访问 存储 器 : 由 于 该 类 型 的 数据 访问 是 专用 集成 电路 通过 直接 存储 器 存 取 
(DMA) 机 制 完成 的 ,所 以 我 们 称 之 为 DMA 操作 。 这 种 访问 基本 与 取 和 存 操作 类 似 , 不 同 的 是 专 
用 集成 电路 要 先 得 到 总 线 的 控制 权 。 在 图 8-25 中 ,B3 对 v2,B4 对 v5 的 访问 属于 这 种 类 型 。 

3) 软件 行为 访问 端口 或 者 专用 集成 电路 的 缓冲 器 :该 类 型 的 数据 访问 通过 处 理 器 的 输 
入 /输出 或 者 转移 指令 完成 。 在 图 8-25 中 ,B2 对 pl1、p2、v4 的 访问 就 属于 这 种 类 型 。 

4) 硬件 行为 访问 专用 集成 电路 的 缓冲 器 :由 于 该 类 型 的 数据 访问 是 专用 集成 电路 对 其 组 
冲 器 访问 完成 的 ,所 以 我 们 称 之 为 缓冲 器 操作 。 在 专用 集成 电路 中 ,这 些 操作 使 用 独立 的 总 
线 。 在 图 8-25 中 ,B3 对 v4 的 访问 属于 这 种 类 型 。 

数据 访问 细 化 的 任务 规定 如 下 : 

1) 为 已 经 映射 到 全 局 地 址 空间 的 变量 和 端口 分 配 地 址 。 

2) 用 取 和 存 操作 代替 软件 行为 对 这 些 已 分 配 到 存储 器 的 变量 的 访问 。 类 似 地 ,用 DMA 
操作 代替 硬件 行为 对 这 些 变 量 的 访问 。 
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pi p2 p3 
图 8-25 系统 描述 映射 到 目标 体系 结构 
3) 用 输入 /输出 操作 代替 软件 行为 对 这 些 已 映射 到 专用 集成 电路 的 变量 的 访问 。 用 缓冲 
器 操作 代替 硬件 行为 对 这 些 变 量 的 访问 。 
4) 用 输入 /输出 操作 代替 任何 软件 行为 对 映射 到 全 局 地 址 空间 的 端口 的 访问 。 


8.6.5 控制 访问 细 化 

不 同 于 行为 和 变量 之 间 的 数据 访问 通道 ,控制 通道 存在 于 两 个 行为 之 间 用 来 指示 行为 的 
开始 或 者 完成 。 图 8-26a 显示 了 对 行为 B1、B2、B3 顺序 调度 的 例子 , 即 B1 结束 之 后 B2 H 
始 , B2 结束 之 后 B3 开始 。 这 样 在 B1 与 B2,B2 与 B3 之 间 存 在 控制 通道 。 如 果 行 为 B2 由 
硬件 实现 , 则 连接 到 B2 的 控制 通道 就 必须 进行 细 化 ,使 之 和 硬件 /软件 接口 一 致 。 

一 个 解决 方案 是 引入 握手 协议 ,使 用 两 个 共享 变量 : start H dones WUE AZRIA F 
B28, B2 本 身 会 被 加 入 匹配 协议 语句 ,如 图 8-26b 所 示 。 如 果 我 们 将 变量 start 和 done 映 
射 到 双 端 口 缓冲 器 ,图 8-26b 所 示 的 描述 可 被 映射 到 图 8-26c 所 示 的 目标 体系 结构 。 控 制 细 
化 可 以 在 对 共享 变量 start M done 的 数据 访问 细 化 完成 后 进行 。 

由 于 B2 移 到 硬件 实现 并 不 影响 其 余 的 软件 部 分 ,所 以 这 个 控制 细 化 方案 是 简单 的 。 但 
是 我 们 还 应 意识 到 ,这 个 方案 需要 处 理 器 对 存储 变量 done 值 的 地 址 进行 轮 询 , 这 可 能 造成 处 
理 器 时 钟 周 期 的 浪费 。 

由 于 商用 处 理 器 通常 提供 中 断 机 制 ,所 以 可 能 采用 更 有 效 的 控制 细 化 方法 。 例 如 ,在 图 
8-27a 中 ,我 们 展示 了 一 种 采用 中 断 机 制 来 指示 硬件 行为 完成 的 方案 。 在 这 个 例子 中 ,B2 被 一 个 
新 的 行为 取代 ,该 行为 包括 一 个 开始 B2 的 协议 语句 。 而 且 ,行为 B2 已 经 被 扩展 ,前 端 包 含 协议 
语句 ,后 端 包含 中 断 语句 。 对 于 每 个 中 断 ,在 软件 划分 部 分 中 插 和 人 相应 的 服务 例 程 。 当 中 断 发 生 
时 ,控制 权 会 被 转移 给 服务 例 程 。 使 用 中 断 机 制 ,处 理 器 可 以 在 B2 完成 之 前 就 开始 B3, 只 要 B2 
和 B3 之 间 不 存在 数据 相关 。 当 然 ,处理 器 也 可 以 选择 开始 另 一 个 软件 行为 ,如 B4。 

控制 访问 细 化 的 任务 总 结 如 下 : | | 

1) 选择 一 个 控制 方案 ,如 轮 询 或 者 中 断 。 然 后 在 软件 和 硬件 行为 中 插入 相应 的 通信 协 
议 。 

2) 插入 必要 的 软件 行为 ,如 中 断 服 务 例 程 。 

3) 对 协议 引入 的 任何 共享 变量 的 访问 进行 细 化 。 
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Start <- true 
wait untit done = true 
start <-- false 





器 
c) 系统 描述 映射 到 目标 体系 结构 


图 8-26 ”控制 访问 细 化 





b) 系统 描述 映射 到 目标 体系 结构 


图 8-27 ”控制 访问 细 化 


8.7 ”结论 和 发 展 方 回 
在 本 章 中 ,我 们 提出 了 在 系统 划分 之 后 必须 执行 的 一 系列 细 化 系统 描述 的 任务 。 我 们 言 
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先 论 证 了 在 系统 设计 中 进行 系统 描述 细 化 的 重要 性 。 我 们 还 讨论 了 与 变量 和 通道 组 实现 相关 
的 问题 。 还 介绍 了 一 种 总 线 生成 的 方法 ,并 评估 了 总 线 宽度 和 系统 性 能 之 间 的 折 中 。 对 于 选 
定 的 总 线 宽度 ,我 们 展示 了 如 何 生成 通信 协议 。 还 讨论 了 对 系统 中 共享 资源 的 访问 冲突 的 解 
决 方法 。 我 们 还 考察 了 绑 定 功能 对 象 到 成 品 组 件 对 通信 的 影响 。 我 们 描述 了 对 两 个 固定 和 不 
兼容 的 协议 建立 接口 的 技术 。 最 后 ,我 们 提出 了 行为 之 间 通 信 的 细 化 方法 ,这 些 行为 已 映射 到 
硬件 和 软件 来 实现 。 

本 章 介绍 的 工作 可 以 在 以 下 几 个 方面 进行 扩展 。 首 先 , 在 协议 生成 过 程 中 ,需要 制定 度量 
用 以 对 选择 来 实现 总 线 传输 的 若干 种 候选 协议 进行 评估 。 其 次 ,在 我 们 讨论 总 线 生 成 的 过 程 
中 ,仲裁 时 延 假定 是 可 忽略 的 ,但 并 非 总 是 如 此 。 我 们 需要 在 行为 执行 时 间 和 通道 平均 速率 中 
结合 进 仲裁 时 延 的 影响 。 再 次 ,不 同 总 线 仲 裁 方 案 对 在 总 线 上 进行 通信 的 行为 的 性 能 影响 也 
要 进行 研究 。 


需要 研究 的 还 有 优化 ,可 应 用 于 使 两 个 协议 兼容 的 接口 进程 。 这 种 优化 的 一 个 例子 就 是 ， 


最 小 化 接口 进程 所 需 变量 的 数量 和 大 小 ,以 减 小 实现 接口 进程 的 硬件 大 小 。 最 后 ,虽然 硬件 摘 
述 语言 对 仲裁 器 和 接口 进程 的 描述 容许 设计 者 对 其 连同 系统 描述 一 起 来 进行 模拟 ,但 采用 传 
统 的 基于 硬件 描述 语言 的 综合 方法 对 这 些 进程 进行 综合 将 导致 低 效 的 设计 。 例 如 ,对 仲裁 进 
程 进行 调度 这 样 的 综合 任务 将 导致 仲裁 器 的 多 状态 实现 。 然 而 ,仲裁 器 通常 只 包含 组 全 逻辑 。 
这 样 ,就 需要 开发 方法 以 有 效 地 从 硬件 描述 语言 的 描述 对 接口 和 仲裁 进 程 进行 综合 。 


8.8 练习 


1. 一 个 变量 组 用 具有 16 位 字 宽 的 存储 器 实现 。 在 存储 器 的 同一 个 地 址 映射 两 个 8 位 宽 的 变 
量 ,一 个 放 在 高 8 位 ,一 个 放 在 低 8 位 。 讨 论 这 种 实现 方式 的 优 缺 点 。 
2. 如 果 一 个 包含 100 个 元 素 的 数组 A 被 分 配 到 地 址 从 201 到 300 的 存储 器 MEM 中 ,在 下 面 
的 一 组 语句 中 更 新 对 A 的 引用 : 
X: = A(30); 
for I in 30 to 60 loop 
Y: =A(I +20) x A( 1-20) +Y; 
end for; 
A(X +A(10)): =3; 
3. 假设 一 个 行为 B 通过 一 组 通道 和 其 他 行为 通信 。 如 何 修改 计算 通道 C 的 平均 速率 的 公式 
7-18, 使 之 将 其 他 通道 所 需 的 通信 时 间 考 虑 进来 。 
4. 在 图 8-10 中 ,对 于 一 个 通过 8 位 总 线 访问 的 标量 变量 生成 了 发 送 和 接收 过 程 。 请 生成 用 
以 通过 总 线 访 问 一 个 数组 变量 A 的 发 送 、 接 收 过 程 。 假 设 A 有 256 个 元 素 ,每 个 元 京 有 
16 位 宽 。 
5. 假设 对 某 共享 资源 有 N 个 并 发 访问 。 请 生成 一 个 实现 循环 优先 级 仲裁 方案 的 仲裁 进程 。 
6. 对 于 图 8- 12b 中 的 动态 仲裁 模型 ,概述 MemArbiter 的 互联 膛 辑 。 请 清楚 地 描述 行为 4、B 
和 C 的 地 址 /数据 线 是 如 何 和 两 个 存储 器 端口 的 地 址 /数据 线 连接 的 。 假 设 每 个 行为 都 可 
对 任 一 存储 器 端口 进行 读 或 写 。 
7. N 个 通道 并 人 一 个 总 线 。 对 这 样 的 总 线 进行 仲裁 ,每 个 通道 需要 两 个 信和 号: request 和 
grant , 即 总 共有 2N 个 信号 。 设 计 一 个 使 仲裁 信号 数量 最 小 化 的 算法 ,方法 是 在 使 用 时 间 


一 
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上 互 斥 的 通道 间 共 享 仲裁 信和 号。 

8. 假设 一 组 访问 共享 资源 的 行为 具有 在 执行 时 间 上 的 约束 。 如 果 采 用 固定 优先 级 的 方案 来 
解决 访问 冲突 ,如 何 确定 行为 的 相对 优先 级 。 

9. 为 算法 8.6.1 的 变量 分 配 设计 启发 式 方法 以 修剪 搜索 空间 。 

10. 应 用 8.6.3 节 中 介绍 的 技术 生成 一 个 接口 ,用 以 将 Intel 8086 的 数据 传输 操作 连接 到 
VME 总 线 。 

11. 请 举例 说 明 行 为 执行 的 顺序 如 何 会 影响 IMO 数据 速率 。 设 计 重新 调度 软件 行为 或 者 操作 
的 技术 ,使 得 能 满足 O 数据 速率 约束 。 | | 

"12, 一 组 行为 ,通过 一 组 通道 通信 ,将 用 单 总 线 实现 。 设 计 一 种 策略 ,能 预测 仲裁 时 延 对 行 

为 执行 时 间 的 影响 。 








BIS 系统 设计 方法 学 


在 本 书 的 前 几 章 里 ,我 们 介绍 了 系统 描述 和 设计 中 的 一 些 核心 问题 和 技术 。 为 了 尽 可 能 
利用 这 些 技术 ,需要 将 它们 结合 进 一 个 能 易于 应 用 到 实际 系统 的 .具有 一 致 性 和 包容 性 的 方法 
学 中 。 在 这 一 章 里 ,我 们 将 提出 这 样 一 种 系统 设计 方法 学 ,概述 能 为 该 方法 学 提供 最 好 支持 的 
工具 ,并 描述 这 些 工具 和 这 种 方法 学 如 何 与 已 有 的 设计 实践 相 联系 。 


9.1 引言 


每 个 产品 从 最 初 的 概念 化 到 最 后 制造 ,都 需要 经 过 许多 设计 阶段 和 任务 。 这 个 过 程 叫做 
设计 过 程 ,而 这 一 系列 的 设计 任务 和 相关 的 CAD 工具 的 技术 被 称 为 设计 方法 学 。 在 较 低 的 抽 
BBA ,设计 方法 学 有 清晰 的 定义 ,并 得 到 了 较 多 商业 CAD 工具 的 支持 。 然 而 在 系统 级 ,这 种 
定义 并 不 是 特别 清晰 ,并 且 可 用 的 CAD 工具 也 很 少 。 此 外 ,不 同 组 织 .设计 组 及 产品 的 系统 方 
法 学 都 有 所 不 同 。 在 这 一 章 里 ,我 们 将 提出 一 种 具有 一 致 性 的 系统 级 方法 学 ,来 帮助 学 术 界 和 
商业 界 研 究 从 逻辑 和 结构 级 到 系统 级 之 间 的 模式 转换 。 

在 前 面 几 章 里 ,我 们 定义 了 系统 级 设计 ,对 系统 描述 的 模型 和 语言 进行 了 讨论 ,并 提出 了 
有 关 划 分 ,评估 和 细 化 方面 的 问题 和 算法 。 在 这 一 章 里 ,我 们 将 把 这 些 概念 联系 起 来 ,形成 系 
统 级 方法 学 。 首 先 ,我 们 通过 一 个 例子 来 解释 方法 学 。 然 后 ,结合 所 提出 的 方法 学 ,我 们 描述 
了 一 个 假想 的 设计 过 程 及 相应 的 综合 系统 。 我 们 还 将 简单 介绍 在 各 个 抽象 级 别 上 的 设计 工 
具 。 最 后 ,我 们 对 支持 系统 级 工具 的 环境 进行 讨论 。 


9.2 基本 概念 
在 提出 系统 级 方法 之 前 ,我 们 首先 对 设计 方法 学 的 内 涵 进 行 定义 。 一 个 设计 方法 学 必须 
清楚 地 指明 以 下 几 点 : 


(a) 输入 和 输出 描述 的 语法 和 语义 ; 

(b) 将 输入 转换 为 输出 描述 的 技术 集合 ; 

(c) 设计 实现 中 用 到 的 组 件 集合 ; 

(d) 设计 约束 的 定义 和 范围 ; 

(e) 组 件 和 体系 结构 的 选择 机 制 ; 

(f) 设计 探索 策略 (通常 称 为 剧本 或 脚本 ), 用 于 定义 综合 任务 及 其 参数 ,以 及 执行 顺序 。 

通常 (a) 和 (b) 可 以 通过 对 描述 语言 和 综合 工具 集合 的 选择 来 定义 ,而 (c) 和 (d) 则 可 以 由 
选择 的 工艺 和 系统 体系 结构 来 确定 。 尚 未 定义 的 (e) 和 (f) 则 是 设计 者 的 任务 。 下 面 将 通过 一 
个 例子 来 解释 上 述 这 些 从 (a) 到 (f) 的 需求 ,并 得 出 一 个 满足 这 些 需 求 的 综合 系统 。 


9.3 设计 方法 学 举例 
这 里 考虑 一 个 交互 式 电视 处 理 器 (ITVP) 的 例子 。 在 播放 首 频 的 同时 ,系统 把 存储 的 视频 帧 


当 作 静止 图 片 显示 出 来 。 用 户 可 以 通过 键盘 . 适 控 天 或 触摸 屏 来 选择 荣 单项 ,结果 是 显示 出 新 的 
视频 帧 ,并 伴 有 音频 这 种 系统 在 旅馆 、 商 店 和 邮局 里 很 常见 ,将 来 还 可 能 在 交互 式 电视 多 媒体 
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环境 里 使 用 。 这 些 系统 可 用 作 旅 馆 的 视频 导航 、 通 过 视频 目录 来 购物 \ 玩 视频 游戏 处理 银行 事 
务 或 者 预订 航班 。 该 系统 置 于 监视 器 或 电视 机 附近 的 一 个 盒子 里 ,就 像 一 个 有 线 电视 机 盒 。 整 
个 系统 示意 图 如 图 9-1 所 示 , 其 中 只 给 出 了 部 分 数据 流 。 一 个 模拟 子 系统 将 模拟 信号 转换 为 数 
字 信 号 ,并 从 视频 输入 中 提取 出 各 种 同步 信号 。 男 一 个 模拟 子 系统 将 数字 信号 转换 为 模拟 信号 
同时 也 执行 其 他 各 种 任务 。ITVP 的 核心 是 一 个 数字 子 系统 ,这 就 是 我 们 设计 的 对 象 。 










WE _out 


Es 
Es 
a 


键盘 
接收 器 


图 9-1 ITVP 的 环境 


对 于 图 9-1 中 的 数字 子 系统 ,其 主要 行为 .数据 对 象 及 数据 流 如 图 9-2 所 示 。 实 际 系 统 中 
含有 32 个 行为 和 69 个 数据 对 象 ,但 为 了 简化 ,图 中 只 显示 出 较 大 和 重要 的 行为 和 对 象 。 系 统 
中 的 行为 StoreAudio 通过 调制 解 调 器 从 音频 输入 接受 大 量 连续 音频 字 节 并 进行 存储 ;行为 
GenerateAudio 根据 命令 来 产生 这 些 音频 字 节 。 由 于 系统 可 能 在 产生 音频 字 节 的 同时 也 在 存 
储 音 频 字 节 ,因此 需要 用 两 个 数组 audiol 和 audio2 来 存储 这 些 音 频 字 节 。 行 为 StoreGener- 
ateVideo 的 功能 是 存储 和 产生 视频 帧 , 它 与 一 个 用 于 存储 视频 字 节 的 数组 video 一 起 发 生 作 
用 。 对 于 系统 支持 的 128 个 ASCII 字符 ,数组 fonts 指明 在 一 个 16 x 16 的 点 阵 中 ,应 该 使 哪 
些 像素 明亮 ,以 显示 任何 一 个 字符 。 男 一 个 数组 screen _ chars 指明 在 30 x 30 个 屏幕 位 置 上 ， 
任何 位 置 显示 哪个 字符 。 行 为 OverlayCharacters 读 取 屏幕 字符 和 字体 (font) 数 组 , 据 此 向 视频 生 
成 器 指明 何 时 需要 用 白色 的 像素 来 覆盖 视频 像素 ,使 得 白字 符 可 以 在 屏幕 上 显示 。 行 为 Store- 
AVOmd 和 变量 av _cmd 获取 一 个 被 编码 的 命令 ,指明 那个 音频 数组 用 来 存储 接受 的 音频 字 节 ， 
以 及 从 哪个 数组 产生 输出 。 这 个 命令 还 规定 了 视频 输入 的 数据 类 型 ,使 得 系统 可 以 扩展 来 用 软 
件 编码 视频 。 软 件 将 在 处 理 器 上 运行 ,来 处 理 时 间 约 束 更 严格 的 交互 式 程序 ,如 视频 游戏 。 行 为 
ProcessRemoteButtons 对 键盘 或 遥控 器 上 的 按钮 动作 做 出 反应 。 行 为 ProcessMainCmds 对 主 计算 
机 发 出 的 命令 做 出 响应 ,而 行为 ProcessAVCmd 则 处 理 编码 后 的 视频 命令 。 

通过 下 列 3 个 主要 步骤 ,可 将 系统 转换 为 物理 实现 [GVN94] : 

1) 功能 描述 :用 语言 来 定义 和 描述 整个 系统 所 需 的 功能 。 功 能 描述 包含 计算 和 可 能 的 时 
延 关 系 , 但 不 包含 任何 涉及 物理 实现 的 细节 。 

2) 系统 设计 :将 标准 系统 组 件 ( 如 ,处 理 器 存储 器 等 ) 和 和 定制 组 件 ( 如 , 门 阵列 \FPGA、 
ASIC 等 ) 分 配给 设计 。 系 统 的 功能 划分 到 这 些 组 件 上 ,结果 将 产生 每 个 组 件 的 功能 描述 。 

3) 组 件 实现 :每 个 组 件 的 功能 将 根据 其 类 型 ,通过 硬件 或 软件 实现 。 
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数字 子 系统 


audio } j 
一 audiol[100k]f8] audio_out 
StoreAudio “一 一 |GenerateAudio 
audio2[100K][8] 


video_out 
video[S00k][8] 一 


ProcessA VCmd StoreGenerate Video 


av_cmd[8] OverlayCharacters fonts[ 128}[16][16] 
screen_chars[30][30}[8] 
StoreA VCmd ProceessMainCmds 





图 9-2 ITVP 中 的 主要 行为 和 数据 流 
在 完成 前 面 两 个 步骤 后 ,系统 组 件 已 得 到 定义 ,此 时 系统 表示 为 设计 者 熟悉 的 “框图 " 形 
式 。 上 述 例子 的 框图 如 图 9-3 所 示 。 系 统 由 6 个 组 件 来 实现 :3 个 存储 器 、2 个 专用 集成 电路 
(ASIC) 和 1 FARHA. E 9-2 中 的 每 个 行为 和 变量 都 只 被 分 配 到 其 中 1 个 组 件 上 。 组 件 
Memory1 存储 数组 audiol 和 audio2, Memory2 存储 video 数组 ,而 Memory3 则 存储 fonts [377 
数组 和 screen _ chars 数组 。ASICI1 实现 行为 StoreAudio 和 GenerateAudio, ASIC2 实现 行为 
StoreGenerateVideo、StoreAVCmd 以 及 变量 av _ cmd, 行为 ProcessAVCmd 、ProcessMainCmds、 
ProcessRemoteButtons 及 OverlayCharacters 都 在 处 理 器 上 实现 。 


StoreGenerateVideo fonts[128][16][16] 


screen_ chars[30][30][8] 
=L 


ProcessMainCmds OverlayCharacters 


main cmds 





图 9-3 一 种 ITVP 的 设计 方案 “ 378 
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证 我 们 考虑 ITVP 设计 例子 中 所 做 的 决策 。 由 于 音频 和 视频 必须 同时 输出 ,因此 用 两 个 
存储 器 来 分 别 存放 音频 数组 和 视频 数组 。 如 果 用 同一 个 存储 器 来 存储 , 则 需要 对 存储 器 进行 
多 路 选择 访问 ,这 就 可 能 违反 最 小 音频 /视频 输出 率 的 约束 。 行为 StoreAudio . GenerateAudio 
和 StoreGenerateVideo 都 在 ASIC 上 实现 ,因为 用 软件 实现 可 能 无 法 满足 输入 输出 速率 的 约 
束 。 由 于 一 个 20 000 门 的 ASIC 无 法 同时 容纳 音频 行为 和 视频 行为 ,因此 它们 实现 于 不 同 的 
ASIC 上 。 行为 StoreAVCmd 和 变量 am _ cmd 也 在 ASIC 上 实现 ,因为 音频 /视频 命令 必须 即 
时 获得 ,这 在 处 理 器 上 很 难 做 到 。 数 组 fonts 和 数组 screen _ chars 不 需要 并 发 访问 ,因此 将 它 
们 映射 到 同一 个 存储 器 上 ,同时 也 不 会 降低 性 能 。 映 射 到 处 理 器 上 的 行为 的 性 能 约束 不 高 , 因 
此 可 以 用 软件 顺序 执行 ,即使 规定 这 些 行 为 并 发 进行 。 

图 9-3 中 的 框图 只 给 出 了 ITVP 的 很 多 实现 方案 中 的 一 种 。 例 如 ,两 个 ASIC 组 件 可 用 一 
个 更 大 的 门 阵列 代 蔡 。 或 者 ,我 们 可 采用 不 同 代 价 和 性 能 特性 的 ASIC 工艺 。 我 们 甚至 采用 
微 控 制 器 来 代替 处 理 器 以 降低 成 本 。 将 行为 和 变量 分 配 到 给 定 组 件 集 上 有 很 多 可 行 的 方案 。 
总 的 来 说 ,系统 设计 就 是 针对 不 同 的 组 件 集体 系 结构 和 工艺 , 枚 举 和 探索 可 能 的 方案 。 

本 章 后 续 内 容 将 就 “什么 是 好 的 系统 设计 方法 学 ?” 和 “这 种 方法 学 需要 什么 工具 的 支持 ?” 
这 两 个 问题 来 展开 讨论 。 

9.3.1 当前 的 惯例 
我 们 现在 来 讨论 当前 在 进行 以 上 三 个 步骤 过 程 中 的 惯例 。 图 9-4 给 出 了 总 结 性 的 图 示 。 
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k | 分 配 
手动 系统 设计 划分 
mie 
总 线 
处 理 器 ASIC | ASIC 存储 
, 功能 O 功能 
| 
组 件 实现 
TEH AS ER HHA 


ASIC i ASIC 存储 器 
ALE RTL (tt RIL RAN 
C 代 码 | | 结构 | | 结构 | | S 


图 9-4 系统 设计 :当前 惯例 和 所 提出 的 设计 方法 学 


379 功能 描述 :系统 功能 使 用 非 正 式 自然 语言 (如 英语 ) 进 行 描述 。 有 时 ,该 描述 还 附 审 有 数据 
流 图 .流程 图 .时 序 图 表 。 从 第 4 章 中 可 以 看 到 ,很 难 建立 一 种 既 精 确 又 易 读 的 自然 语言 描述 。 
这 样 , 多 数 的 自然 语言 描述 为 了 保持 可 读 性 ,给 出 的 是 非 精确 的 描述 。 
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系统 设计 :系统 设计 以 手动 方式 进行 ,通常 采用 特定 的 方式 , 即 设计 决策 是 建立 在 先前 经 
验 或 手工 计算 的 质量 评 佑 的 基础 上 的 。 手 动 设计 方法 学 有 如 下 几 个 缺点 。 首 先 ,如 第 6 章 所 
示 , 人 工 考 虑 所 有 可 能 的 设计 方案 耗 时 太 长 。 其 次 ,在 评估 中 需要 考虑 很 多 细节 ,因此 很 难 获 
得 精确 的 评 佑 结果 ,正如 在 第 7 章 中 所 讨论 过 的 。 再 次 ,对 系统 设计 决策 做 出 书面 文档 也 是 元 
长 耗 时 的 工作 ,因而 在 多 数 情况 下 都 被 设计 者 所 忽略 。 
组 件 实现 :获得 系统 框图 后 ,每 个 组 件 的 功能 都 以 自然 语言 描述 。 该 描述 用 于 设计 每 个 组 

件 的 寄存 紫 传 输 级 或 逻辑 级 结构 。 在 某 些 情况 下 ,用 可 执行 语言 来 描述 组 件 的 功能 ,这 样 就 可 

以 进行 功能 验证 。 在 很 少数 情况 下 , 才 会 使 用 高 层次 综合 工具 从 组 件 的 功能 描述 来 设计 寄存 
能 传输 级 结构 。 

总 之 ,当前 设计 惯例 很 少 注重 功能 描述 和 系统 设计 ,而 过 分 强调 组 件 的 实现 。 在 系统 级 
上 ,这 种 设计 工作 的 缺乏 可 以 归 因 于 缺少 得 到 检验 的 设计 方法 学 和 支持 设计 任务 的 工具 。 


9.3.2 系统 级 方法 学 

接 下 来 对 本 书 中 描述 的 方法 学 进行 讨论 。 同 样 如 图 9-4 所 示 。 

功能 描述 :系统 功能 使 用 可 执行 语言 而 不 是 自然 语言 进行 描述 。 在 系统 设计 开始 之 前 ,可 
以 通过 执行 验证 和 模拟 来 确保 正确 的 功能 。 通 过 这 两 步 可 获得 对 功能 的 极为 精确 的 描述 。 

系统 设计 :系统 设计 包含 3 个 明确 定义 的 任务 ,分 别 在 3 类 的 功能 对 象 上 执行 ,如 图 9-5 
所 示 。 在 任何 功能 描述 中 都 包含 的 3 类 功能 对 象 是 变量 行为 和 通道 。 变 量 用 来 存储 数据 , 行 


为 对 数据 进行 转换 ,而 通道 用 于 在 行为 之 间 传 输 数据 。 在 每 类 对 象 上 ,都 执行 3 个 任务 :分 配 、 





划分 和 细 化 。 
系统 设计 任务 
m 变量 变量 到 存储 器 I 地 址 分 配 
器 行为 | ”行为 到 处 理 器 | #0 
R ë 总 线 通道 到 总 线 1 “仲裁 /协议 


图 9-5 系统 设计 任务 


分 配 为 给 定 的 功能 描述 定义 系统 组 件 。 第 1 类 系统 组 件 包 含 存储 器 .ROM 寄存 器 文件 
以 及 寄存 舌 。 它 们 用 于 存储 标量 和 数组 变量 。 第 2 类 组 件 包含 处 理 单 元 ,如 标准 处 理 背 、 微 控 
iil dt & ASIC 芯片 。 这 些 标准 和 定制 的 处 理 絮 可 用 来 实现 行为 。 第 3 类 包括 物理 总 线 , 用 来 

划分 将 功能 对 象 分 配 到 各 个 组 件 上 。 变 量 、 行 为 和 通道 分 别 分 配 到 存储 名 、 标 准 / 和 定制 处 
理 器 和 总 线 上 ,正如 第 6 章 中 所 讨论 过 的 。 

细 化 对 原始 描述 进行 修改 ,来 反映 给 定 的 分 配 和 划分 的 影响 。 划 分 到 存储 郁 上 的 变量 需 
要 存储 器 地 址 译 码 。 不 同 组 件 上 的 行为 需要 进行 修改 ,来 保证 它们 之 间 的 正确 通信 。 分 配 到 
总 线 上 的 通道 需要 进行 接口 综合 来 确定 通信 协议 ,并 且 需 要 仲裁 综合 来 解决 对 总 线 的 并 发 请 
求 问 题 。 细 化 是 第 8 章 的 主题 。 

上 述 3 个 任务 将 不 含有 任何 实现 细节 的 功能 描述 转换 为 一 个 新 的 描述 ,新 描述 包含 一 些 
结构 信息 ,这 些 结构 信息 描述 了 系统 级 的 体系 结构 。 
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应 用 上 述 3 个 任务 的 先后 顺序 并 不 固定 。 一 种 可 能 获得 较 好 结果 的 任务 顺序 如 图 9-6 所 
示 。 功 能 被 描述 后 ,大量 变量 被 映射 到 存储 器 ,并 且 接 近 度 好 的 变量 (定义 见 第 6 章 中 对 变量 
接近 度 的 定义 ) 将 共享 同一 个 存储 器 。 通 道 用 类 似 的 方式 映射 到 总 线 。 接 着 分 配 处 理 器 或 A- 
382| ”SIC 组 件 , 将 行为 (以 及 没有 分 配 到 存储 器 上 的 变量 ) 划 分 到 这 些 组 件 上 ,并 使 得 软件 和 人 硬件 的 
总 成 本 最 小 。 此 后 ,还 可 能 对 变量 或 通道 进行 再 划分 ,以 进一步 降低 成 本 。 最 后 需要 进行 接口 
综合 和 仲裁 综合 ,以 获得 系统 中 每 个 组 件 的 完整 的 功能 描述 。 


1. 功能 性 描述 


OO eee eee eee eS ee ‘UM ‘Me i e e — e 


2. 系统 设计 


OO meee eee eee a ee ee ee ‘UM — eee a 


3. 组 件 实现 





软件 实现 硬件 实现 


图 9-6 一 种 系统 设计 任务 的 安排 顺序 


组 件 实现 :通过 将 组 件 的 功能 描述 编译 为 机 器 代码 可 以 实现 软件 组 件 ,而 ASIC 组 件 通过 
手工 设计 或 采用 CAD 工具 进行 综合 。 由 于 组 件 是 形式 化 定义 的 , 故 采用 综合 更 自然 。 


9.4 通用 综合 系统 


这 一 节 里 ,我 们 提出 一 个 假想 的 通用 综合 系统 ,用 于 嵌 人 式 系 统 设 计 中 从 概念 到 制造 的 变 
换 。 该 系统 的 通用 性 体现 在 它 集结 了 前 面 章节 所 讨论 到 主要 概念 。 该 系统 是 假想 的 则 是 因为 
现 有 的 研究 或 商业 综合 系统 都 不 能 全 部 满足 下 面 的 准则 : 
(a) 完整 性 :系统 需要 提供 设计 过 程 中 所 有 级 别 上 的 综合 工具 ,包括 从 描述 到 制作 文档 。 
而 且 这 些 工具 应 能 适应 多 种 实现 风格 。 
(b) 可 扩展 性 :系统 必须 足够 灵活 , 允许 增加 新 的 算法 和 工具 ,以 及 对 新 的 实现 风格 的 
支持 。 








系统 设计 方法 学 207 





(c) 可 控制 性 :对 特定 的 描述 ,设计 者 应 可 以 控制 所 要 应 用 的 工具 类 型 以 及 执行 顺序 。 设 
计 者 还 应 该 能 通过 选择 组 件 拓扑、 体系 结构 和 工艺 来 控制 对 设计 空间 的 探索 。 为 了 
帮助 设计 者 做 出 选择 ,系统 还 应 提供 多 种 设计 质量 度量 和 权衡 的 线索 。 

(d) 交互 性 :设计 者 应 能 和 综合 工具 进行 交互 ,主要 通过 部 分 地 规定 设计 结构 ,以 及 在 综 

合 后 对 设计 进行 修改 来 实现 。 
(e) 可 升级 性 :综合 系统 应 该 允许 方法 学 从 “捕获 -模拟 "到 “描述 -综合 ”的 进化 升级 ,并 
且 人 允许 在 每 个 抽象 级 别 上 混合 使 用 两 种 策略 。 

该 通用 综合 系统 的 总 体 框图 以 [GDWL91] 中 描述 的 一 个 类 似 系统 为 基础 ,如 图 9-7 所 示 。 该 
系统 是 完整 的 ,因为 它 支持 在 系统 .芯片 .逻辑 及 物理 等 级 别 上 的 综合 ,包括 软 便 件 协同 设计 。 该 
系统 含有 一 个 综合 工具 ,用 来 将 可 执行 描述 划分 为 一 组 描述 ,其 中 每 个 都 用 定制 、. 半 定制 或 者 标 
准 组 件 来 实现 系统 功能 。 软 件 综合 工具 将 处 理 器 的 描述 转换 为 标准 代码 ,该 代码 可 以 编译 为 处 
理 器 的 指令 集 。ASIC 综合 工具 把 芯片 的 描述 综合 为 一 组 寄存 器 传输 级 组 件 。 一 个 时 序 和 逻辑 
综合 工具 将 FSM 和 逻辑 描述 转换 为 门 级 网 表 。 下 面 对 每 个 综合 工具 进行 详细 介绍 。 

系统 描述 设计 者 


系统 综合 


并 

= 

| 
up 

[ 


| ASIC 综合 


ax 
oo 

中 间 格 式 
概念 化 环境 


编译 逻辑 / 时 序 综合 C 


验证 / 模拟 套件 
描述 生成 器 


TD 
a 


物理 设计 综合 


汇编 代码 用 于 制造 的 
ASIC 描述 


图 9-7 一 种 通用 综合 系统 


该 通用 系统 具有 一 个 概念 化 环境 来 支持 交互 性 和 可 控制 性 。 扩 展 性 由 两 个 数据 库 来 文 
持 。 组 件数 据 库 (Component database,CDB) 支 持 增加 新 组 件 以 进行 ASIC 综合 ,而 系统 数据 库 
(System database, SDB) 则 支持 设计 工程 和 管理 。 

系统 同时 支持 “捕获 -模拟 "和 “描述 -综合 ”方法 。 通 过 在 概念 化 环境 中 捕获 原理 图 并 使 
用 模拟 套件 中 的 某 个 模拟 器 进行 模拟 ,可 以 实现 对 第 1 个 方法 的 支持 ;对 第 2 个 方法 的 支持 则 
是 通过 对 以 一 种 或 多 种 捕获 语言 表示 的 设计 描述 进行 捕获 ,并 采用 适当 的 综合 工具 进行 综合 





208 PIE 


得 到 的 。 概 念 化 环境 提供 了 多 种 捕获 语言 。 

概念 化 模型 在 不 同 的 设计 角度 和 设计 阶段 上 采用 不 同 的 中 间 格 式 。 捕 获 的 设计 描述 被 转 “ 
换 成 某 种 综合 和 模拟 所 接受 的 一 种 标准 中 间 格 式 。 可 以 对 所 有 抽象 级 别 和 设计 风格 定义 一 种 
通用 语言 ,来 代替 这 许多 种 中 间 格 式 。 但 是 ,这 样 一 种 语言 可 能 过 于 笨重 和 低 效 。 而 且 , 需 要 很 
长 的 时 间 才 能 形成 标准 ,可 能 需要 更 长 的 时 间 才 能 让 设计 者 学 会 如 何 使 用 。 另 一 方面 ,我 们 可 以 
采用 VHDL 之 类 的 标准 模拟 语言 。 然 而 ,为 支持 模拟 所 需 的 结构 是 这 种 语言 的 负担 ,而且 该 语言 
很 难 用 于 捕获 设计 的 其 他 方面 。 上 鉴于 上 述 原因 ,采用 特定 的 中 间 格 式 是 便利 的 ,每 种 特定 的 中 间 
格式 都 接近 于 设计 者 对 问题 的 观察 视角 ,捕获 特定 的 设计 信息 ,只 要 我 们 提供 一 个 模拟 代码 生成 
俘 来 将 中 间 格 式 转换 为 可 模拟 的 描述 。 具 有 该 用 途 的 描述 生成 器 如 图 9-7 所 示 。 

代码 生成 器 的 概念 符合 “捕获 - 模拟 "方法 。 例 如 ,可 以 将 示意 图 看 做 中 间 格 式 , 通 过 网 表 
生成 器 转换 为 可 模拟 描述 。 与 此 类 似 , 逻辑 时序、 寄存 器 传输 及 系统 级 上 的 中 间 格 式 可 转换 
AY VHDL 或 其 他 模拟 语言 。 这 种 方法 使 被 捕获 的 描述 更 接近 于 设计 者 的 思维 方式 ,并 且 对 于 
具有 描述 生成 器 的 任何 标准 模拟 器 来 说 是 可 模拟 的 。 此 外 ,这 种 中 间 格 式 可 用 于 交互 式 综合 
以 支持 对 描述 和 设计 的 手动 分 配 、 划 分 、 建 立 接口 、 仲 裁 、 变 换 、 验 证 ,以 及 对 设计 质量 和 设计 变 
化 对 质量 的 影响 进行 评估 。 

接 下 来 将 对 该 通用 综合 系统 中 的 每 个 部 分 进行 简要 介绍 。 

9.4.1 系统 综合 

系统 综合 接受 整个 系统 的 可 执行 描述 ,将 其 划分 为 一 组 可 执行 描述 ,其 中 每 部 分 都 用 定 
制 、 半 定制 或 标准 系统 组 件 来 实现 。 每 个 组 件 描述 都 满足 该 组 件 的 所 有 约束 。 例 如 ,如 果 某 个 
组 件 是 一 个 50 000 门 的 门 阵列 ,含有 100 个 引 脚 , 则 组 系统 行为 描述 
件 描述 的 实现 必须 少 于 50 000 门 ,并 且 用 于 数据 通信 和 
电源 的 引 脚 也 必须 少 于 100。 同 时 ,如 果 组 件 是 标准 存 
储 器 , 则 组 件 的 描述 必须 包含 存储 器 访问 数据 的 协议 。 
与 此 类 似 , 对 标准 处 理 器 ,组 件 的 描述 在 编译 为 机 器 码 
后 ,必须 在 给 定 的 约束 时 间 内 执行 完毕 。 

一 种 系统 综合 环境 如 图 9-8 所 示 , 包 含 一 个 带 相 应 
系统 表示 (SR ) 的 编译 器 和 一 组 系统 设计 工具 。 分 配器 
(Allocator) 选 择 设计 中 所 需 系 统 组 件 的 类 型 和 数量 。 划 
分 器 (Partitioner) 将 SR 的 每 部 分 分 配 到 组 件 上 。 如 第 6 
章 所 述 ,分 配器 和 划分 器 都 会 在 SR 中 加 入 自己 生成 的 
新 信息 。 评 估 器 (Estimator) 快 速 地 回 分 配器 和 划分 器 
提供 各 种 质量 度量 的 评估 值 ,如 第 7 章 所 述 。 接 口 综合 
工具 在 系统 组 件 间 加 入 通信 总 线 的 协议 描述 。 仲 裁 综 
合 工 具 对 并 发 总 线 的 访问 增加 新 的 描述 。 最 后 两 个 工 
具 在 从 原始 系统 描述 到 组 件 描 述 的 转换 过 程 中 具有 本 
质 上 的 重要 性 ,这 点 在 第 8 章 里 进行 了 介绍 。 

变换 器 (Transformer) 工 具 是 图 中 唯一 一 个 前 文 没 | RARE “ 

有 提 及 的 内 容 。 它 执行 一 组 SR 变换 ,以 便 在 最 终 设计 ”图 9-8 一 种 通用 的 系统 综合 环境 





片 综合 
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里 改善 某 些 质量 度量 。SR 需要 进行 变换 的 原因 是 它 得 自 于 具有 可 读 性 却 不 易于 划分 的 描述 。 


例如 ,过 程 P 可 能 用 于 封装 一 个 复杂 的 计算 ,该 计算 在 描述 中 的 多 处 使 用 。 如 果 用 单个 FS- 
MD 来 实现 已 ,在 其 他 多 个 FSMD 调用 P 的 情况 下 ,将 导致 大 量 的 引 脚 数量 或 者 很 差 的 性 能 。 
在 这 种 情况 下 ,对 P 进行 复制 并 将 其 加 入 到 每 个 调用 它 的 FSMD 中 也 许 是 一 种 较 好 的 方案 。 
另 一 种 更 好 的 方案 是 内 和 已 ,这 将 会 导致 元 余 的 硬件 ,但 能 够 提高 性 能 并 减 小 互联 开销 。 其 他 
可 能 的 变换 包括 :(a) 展 开 循 环 ,以 暴露 更 多 的 并 发 性 。(b) 将 数组 变量 分 为 一 组 标量 变量 ,或 
者 将 行为 分 为 一 组 更 细 粒 度 的 行为 ,以 此 来 提供 更 多 的 划分 选择 。(c) 将 并 发 行为 顺序 化 以 减 
少 所 需 的 FSMD 数量 。(d) 将 顺序 行为 并 行 化 以 提高 性 能 。 由 于 一 个 特定 的 变换 可 能 促成 或 
限制 一 个 或 多 个 其 他 变换 ,因此 这 些 变换 间 具 有 很 强 的 相互 联系 。 

尽管 系统 级 变换 领域 的 研究 显示 出 很 有 前 景 的 结果 [TAS93,HT93,WT89,IOJ94j], 但 变换 在 
系统 设计 中 的 角色 仍 不 是 特别 明确 。 描 述 变换 在 未 来 将 成 为 系统 设计 中 的 第 四 个 主要 任务 。 


9.4.2 ASIC 综合 

系统 综合 定义 了 一 组 具有 固定 接口 的 系统 组 件 , 以 及 每 个 组 件 的 可 执行 描述 。 芯 片 综合 
通常 也 叫做 高 层次 综合 (high-level synthesis, 行为 描述 
HLS) , 它 将 组 件 的 描述 转换 为 寄存 器 传输 级 
组 件 (register-transfer component, RTC) 的 结 
构 , 这 里 的 RTC 包括 寄存 器 、 多 路 选择 从 和 
ALU 等 。 这 种 结构 通常 包含 两 个 部 分 , 其 一 
是 控制 器 ,用 来 实现 有 限 状 态 机 ;其 二 是 数据 
通路 ,用 来 执行 算术 操作 。 我 们 称 这 种 结构 为 
带 数 据 通 路 的 有 限 状 态 机 ,或 者 FSMD 
[GDWL91]。 控 制 器 控制 数据 通路 中 的 寄存 
器 传输 ,产生 同 外 界 通信 的 信和 号。 根据 
[BM89, BCD* 88, CR89, TLW* 90, CST91, 
Gaj91,KD91, LND* 91, NON91 ] 中 的 思想 得 
到 的 通用 芯片 综合 环境 如 图 9-9 所 示 。 

综合 环境 包含 一 个 带 有 相应 表示 方案 的 
编译 器 ,一 组 HLS 工具 ,一 个 RIC 数据 库 , 工 
艺 上 映射 器 及 一 个 优化 器 。 输 入 的 可 执行 描述 
首先 被 编译 为 一 种 称 为 控制 /数据 流 图 (con- 
trol/dataflow graph，CDFG) 的 设计 表示 , 它 表 
示 出 基本 操作 (如 加 法 和 比较 ) 之 间 的 控制 和 
数据 依赖 关系 。 例 如 ,图 9-10 显示 出 一 个 简 
单 的 行为 和 相应 的 CDFG。 需 要 注意 的 是 ,加 
法 操作 “a + b” 和 比较 操作 “a = 6” 即 使 在 描述 
中 以 顺序 方式 书写 ,也 可 以 并 行 执行 。 而 减法 mune 
操作 “x 一 y” 必须 在 “a + 0 之 后 进行 ,因为 = 
依赖 于 “a + 5b” 的 计算 结果 。 





图 9-9 一 种 通用 的 芯片 综合 环境 
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一 些 高 层次 综合 工具 在 建立 寄存 器 传输 级 结构 的 时 候 对 描述 进行 标注 。 组 件 选 择 器 从 
RTC 数据 库 中 选择 设计 中 使 用 的 存储 、 功 能 及 总 
线 等 单元 。 调 度 器 将 操作 映射 到 控制 步 , 其 中 每 个 
控制 步 通常 代表 一 个 时 钟 周期 或 时 钟 相位 。 由 于 
数据 依赖 关系 或 执行 特定 操作 的 单元 数量 有 限 ,所 
有 操作 通常 不 可 能 立即 执行 ,因此 需要 进行 调度 。 
在 该 例子 中 ,加 法 和 比较 操作 如 果 使 用 不 同 的 
ALU, 就 可 以 在 一 个 控制 步 里 执行 。 条 件 “a = b” 
可 在 第 2 个 控制 步 检 查 , 接 下 来 两 个 控制 步 里 进行 
减法 和 小 于 操作 。 注 意 由 于 减法 和 小 于 操作 存在 
数据 依赖 关系 ,因此 不 能 在 一 个 控制 步 里 执行 。 调 
度 是 ASIC 综合 研究 中 的 一 个 核心 课题 之 一 ,已 有 
许多 不 同 的 算法 [GDWL91]j。 存 储 、 功 能 及 互联 等 
单元 绑 定 器 将 标量 和 数组 变量 .操作 以 及 互联 分 别 
映射 到 寄存 器 和 存储 器 、 功 能 单元 以 及 总 线 上 。 在 图 910 CDFG RIF 
上 述 例子 中 ,可 以 选择 两 个 ALU, FE“ +” 和 “一 ”操作 、“=” 和 “< ”操作 分 别 分 配 到 其 上 。 虽 然 
多 数 研究 都 假设 使 用 一 组 基本 的 寄存 器 传输 级 组 件 ,近年 来 的 研究 则 关注 于 使 用 更 加 实际 的 
组 件 库 。 

显然 ,对 于 一 个 特定 的 描述 ,选择 .调度 或 绑 定 的 方案 不 是 唯一 的 。 例 如 ,上 述 例子 可 以 只 
使 用 一 个 ALU, 这 样 “+ A“ = ”操作 总 共 需 要 两 个 控制 步 来 执行 ,而 不 是 一 个 。 也 可 以 将 
“一 ”操作 和 条 件 判 断 “a = 2” 放 在 同一 个 控制 步 里 执行 ,并 且 在 比较 操作 判断 为 假 时 抛弃 “ 一 ” 
操作 的 结果 。 这 些 只 是 不 同 选择 、 绑 定 及 调度 的 例子 中 的 两 个 。 不 同 的 选择 、 绑 定 及 调度 决 
策 所 得 到 的 设计 主要 在 面积 和 性 能 上 有 差别 。 有 时 ， 面 积 约束 优先 级 高 于 性 能 。 在 这 些 情 况 
下 ， 设 计 目 标 即 为 选择 满足 面积 约束 的 组 件 ， 并 获得 最 好 性 能 。 另 外 一 些 时 候 ， 人 性 能 约束 优 
先 级 较 高 。 在 这 些 情况 下 ， 设 计 目 标 则 为 在 满足 性 能 约束 的 条 件 下 ， 选 择 面积 最 小 的 一 组 
组 件 。 

需要 明确 的 是 选择 、 绑 定 及 调度 这 些 任务 之 间 有 很 强 的 关联 。 如 果 先 进行 选择 和 比 定 ,就 
限制 了 可 能 的 调度 。 例 如 ,两 个 操作 绑 定 到 同一 个 组 件 上 ,就 不 能 调度 到 同一 个 控制 步 肉 。 另 
一 方面 ,如果 先 对 操作 进行 调度 , 则 会 限制 选择 和 绑 定 。 例 如 , 将 两 个 操作 调度 到 同一 个 控制 
步 内 , 则 它们 就 无 法 共享 一 个 组 件 。 在 [CT90,BM89,Geb92a] 中 ,研究 者 尝试 将 选择 、 绑 定 和 
调度 合并 到 一 个 算法 里 ,以 此 来 处 理 这 三 个 任务 间 的 相关 性 。 这 三 个 任务 中 的 每 一 个 都 是 
NP 完全 问题 。 

组 件数 据 库 (component database，CDB) 储 存 寄存 器 传输 级 组 件 ,可 供 综合 过 程 中 使 用 ,并 
可 对 它们 的 特性 进行 查询 。 工 艺 映 射 器 将 通用 组 件 从 综合 后 的 设计 描述 映射 到 CDB 中 的 组 
件 实例 。 由 于 映射 到 实际 组 件 后 ,评估 得 到 的 关键 路 径 及 其 上 的 延迟 可 能 有 所 改变 ,因此 使 用 
微 体系 结构 优化 器 来 减 小 关键 路 径 上 的 时 延 ,做 法 是 重新 分 配 组 件 , 在 关键 路 径 上 插 和 人 更 快 的 
组 件 , 在 非 关 键 路 径 上 插入 较 慢 的 组 件 。 

CDB 中 的 某 些 组 件 ,如 存储 器 和 多 路 选择 器 , 通过 标准 宏 单元 来 实现 。 其 他 组 件 , 如 
ESMD , 则 从 行为 描述 综合 而 得 到 。 在 物理 设计 过 程 中 ,它们 共同 组 成 一 个 ASIC, 
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9.4.3 逻辑 综合 和 时 序 综合 

芯片 综合 产生 一 组 控制 器 和 数据 通路 。 每 个 控制 器 用 有 限 状态 机 (FSM) 建 模 。 控 制 器 综 
合 工 具 必 须 将 FSM 转换 为 硬件 结构 ,包括 一 个 状态 寄存 器 和 用 于 产生 次 态 及 控制 器 输出 的 组 
合 电 路 。 生 成 这 种 结构 的 任务 包括 状态 最 小 化 状态 编码 、 人 逻辑 最 小 化 及 工艺 映射 。 基 于 
[DSVA87,BRSVW87,DMNSV88] 中 思想 的 通用 逻辑 综合 系统 如 图 9-11 所 示 。 


_ 布尔 存储 器 
状态 表 表达 式 时 序 图 描述 


图 9-11 一 种 通用 逻辑 综合 工具 


状态 最 小 化 是 用 一 个 状态 来 代替 所 有 与 其 等 价 的 状态 ,以 减少 FSM 中 的 状态 数 。 所 谓 两 
个 状态 等 价 , 是 指 对 于 任何 输入 序列 ,无 论 我 们 从 哪个 状态 开始 ,输出 序列 都 相同 。 状 态 最 小 
化 的 重要 性 体现 在 状态 的 数量 决定 了 状态 寄存 器 和 控制 逻辑 的 大 小 。 

状态 编码 对 符号 状态 分 配 二 进 制 代 码 , 其 目标 是 最 小 化 编码 控制 器 的 组 全 多 辑 。 加 辑 最 
小 化 用 于 在 编码 后 减 小 组 合 逻 辑 的 面积 或 时 延 。 

两 级 组 合 逻 辑 通常 用 PLA 来 实现 ,而 多 级 有 逻辑 可 用 标准 逻辑 库 实现 。 工 艺 映射 接受 逻辑 
最 小 化 器 产生 的 与 工艺 无 关 的 逻辑 网 络 ,将 其 转换 为 由 特定 库 中 的 标准 门 组 成 的 网 表 。 

由 于 我 们 假设 每 个 设计 都 可 以 用 一 组 相互 通信 的 进程 来 描述 ,并 采用 一 组 相互 通信 的 
FSMD 来 实现 ,因此 设计 通信 逻辑 是 综合 的 一 个 必需 的 部 分 。 接 口 电 路 可 以 实现 成 为 每 个 
FSMD 的 组 成 部 分 ,也 可 以 用 独立 的 FSMD 来 实现 。 如 果 通 信 协 议 是 FSMD 描述 的 一 部 分 ， 
那么 由 于 输出 信号 只 在 状态 的 边界 处 发 生变 化 ,协议 信号 的 响应 就 需要 整数 个 状态 或 时 钟 周 
期 。 例 如 ,对 一 个 请 求 -确认 协议 ,可 以 用 一 个 等 待 状态 和 一 个 确认 状态 来 实现 。 请 求 信 和 号 的 
到 来 使 FSMD 由 等 待 状态 进入 到 确认 状态 ,并 导致 确认 信号 变 为 有 效 。 当 请 求 信 号 被 撤销 
后 ,FSMD 将 离开 确认 状态 。 另 一 方面 , 当 两 个 具有 不 同 协议 的 标准 FSMD 必须 建立 接口 时 ， 
就 必须 综合 出 另 一 个 FSMD 来 将 一 个 协议 转换 成 另 一 个 协议 [Ber91,NT86]。 

由 于 缺乏 接口 描述 语言 和 针对 同步 /异步 混合 时 序 逻 辑 的 综合 方法 ,接口 综合 是 一 个 难 
点 。 通 信 协 议 通 常用 带 时 间 约 束 的 时 序 图 来 描述 ,如 商业 存储 器 和 微 处 理 器 手册 中 给 出 的 存 
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伴侣 读 与 周期 描述 。 接 口 综合 包括 将 时 序 图 映 映 到 最 少数 量 的 锁 存 器 和 触发 器 ,减少 设置 和 


再 设置 需要 的 逻辑 。 根 据 标准 组 件 支持 的 协议 ,接口 逻辑 可 以 是 同步 的 或 者 是 异步 的 。 

存储 器 综合 根据 给 定 的 存储 器 需求 生成 存储 器 的 结构 ,这 里 的 需求 包括 字数 、 每 个 字 的 位 
数 .端口 数 .端口 类 型 ( 读 、 写 或 读 / 写 ) .访问 速率 .访问 协议 及 时 延 约 束 等 。 对 某 些 需求 ,存储 
器 综合 可 能 会 很 复杂 。 例 如 ,只 用 单 端口 存储 器 芯片 来 设计 一 个 四 端口 的 存储 器 ,如 果 数 据 能 
分 为 四 组 , 且 每 组 只 通过 一 个 端口 来 访问 ,那么 综合 就 会 很 简单 。 然 而 ,如 果 同 样 的 数据 需要 
通过 两 个 不 同 的 端口 来 访问 ,或 两 个 端口 访问 同一 个 单 端口 存储 器 芯片 的 数据 ,那么 就 需要 引 
入 解决 冲突 的 逻辑 ,从 而 增加 存储 器 的 访问 时 间 。 


9.4.4 物理 设计 
执行 上 述 综 合 步骤 之 后 ,设计 的 硬件 部 分 就 被 描述 成 为 逻辑 级 和 寄存 器 传输 级 组 件 的 网 


表 。 大 量 的 工艺 可 用 于 这 种 网 表 的 物理 实现 ,每 种 工艺 都 有 自己 的 设计 方法 。 比 如 ,网 表 可 以 


用 定制 版 图 来 实现 。 这 种 实现 的 设计 问题 包括 品 体 管 布局 和 定向 .晶体 管 大 小 改变 以 及 布线 。 
诸如 8 位 ALU 等 规则 结构 可 以 采用 模块 生成 器 来 实现 ,并 通过 利用 规则 性 来 获得 非 带 紧 闭 的 
版 图 。 如 果 采 用 标准 单元 来 代替 定制 版 图 , 则 单元 的 布局 和 布线 是 关键 问题 。 同 样 ,也 可 以 使 
用 模块 生成 顺 。 

一 种 常用 的 方法 是 采用 现场 可 编程 门 阵列 (FPGA) ,其 中 含有 数 百 个 模块 阵列 和 接线 开 
KE ,以 及 组 合 / 人 时序 逻 辑 [Xil89]。 逻 辑 块 有 n TWA Mm 个 输出 ,其 中 和 7 是 2 一 10 之 
问 的 整数 。 这 些 模 块 和 开关 盒 可 由 设计 者 在 现场 编程 ,克服 了 标准 单元 和 定制 方法 设计 周期 
长 的 缺点 。 设 计 问 题 包括 将 逻辑 表达 式 分 解 为 一 个 2 输入 的 表达 式 , 及 将 该 n 输入 表达 式 分 
配 到 逻辑 块 并 使 得 门 阵 列 具 有 可 布线 性 (routable) 。 


9.4.5 软件 综合 

可 执行 描述 与 C 等 传统 程序 设计 语言 相 比 ,通常 具有 一 些 独 有 的 特点 。 典 型 的 编译 器 通 
常 不 能 处 理 这些 特 点 。 软 件 综合 的 任务 是 将 复杂 的 可 执行 描述 转换 为 传统 软件 程序 ,使 其 可 
以 用 传统 的 编译 器 来 编译 。 | 

可 执行 描述 的 特点 之 一 是 并 发 任务 的 定义 。 如 果 两 个 并 发 任务 映射 到 一 个 处 理 器 上 , 则 
必须 经 过 调度 来 顺序 执行 。 这 种 调度 通常 称 为 多 道 程 序 设 计 | HB85]。 在 调度 中 ,重要 的 是 确 
保 每 个 任务 都 有 机 会 执行 , 即 没 有 任务 “ 饿 死 "?。 另 一 个 问题 是 最 小 化 处 理 紫 等 待 外 部 事件 所 
需 的 时 间 , 即 最 小 化 “ 忙 -- 等"。 第 三 个 问题 是 保证 满足 每 个 任务 的 时 间 约 束 。 例 如 ,数据 以 特 
定 的 速率 到 达 ,必须 被 指定 的 任务 获得 并 处 理 , 或 者 为 保证 系统 性 能 , 某 任 务必 须 以 茶 种 速率 
输出 数据 。 这 种 任务 必须 确保 最 小 的 执行 速率 。 

现 有 若 于 种 技术 能 处 理 这 种 调度 [HB85,GD93,AS83]。 其 中 一 种 使 用 全 局 任务 调度 器 ， 
通过 类 似 子 例 程 调 用 的 方法 来 激活 每 个 任务 (或 其 中 一 部 分 )。 这 种 技术 在 任务 之 间 切 换 的 时 
候 , 需 要 增加 开销 来 保持 每 个 任务 的 状态 。 另 一 种 技术 在 每 个 任务 里 保持 局 部 数据 来 记录 状 
态 , 并 且 在 任务 需要 等 待 事 件 或 中 断 的 时 候 将 任务 改 为 不 接受 处 理 器 控制 ,以 此 来 减 小 上 述 开 
销 。 不 同 技术 的 选择 通常 涉及 人 性 能 和 程序 大 小 之 间 的 折 中 。 

有 的 时 候 , 我 们 可 能 希望 将 一 组 并 发 任务 映射 到 多 处 理 器 上 。 在 这 种 情况 下 ,就 必须 涉及 
与 多 机 处 理 相 关 的 问题 [HP85 J. 7 

对 于 这 种 必须 转换 为 可 编译 格式 的 描述 , 另 一 个 普遍 特点 是 使 用 时 间 相 关 的 语句 ,如 
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VHDL 里 的 wait 语句 或 HardwareC 里 的 并 发 语句 。 这 种 语句 通常 被 转换 为 一 组 等 价 的 传统 
程序 语句 ,并 可 能 增加 一 些 额 外 变量 ,这 一 点 在 第 5 章 里 进行 了 讨论 。 


9.4.6 系统 数据 库 

传统 的 综合 系统 开始 于 一 些 松 散 的 和 相互 独立 的 设计 工具 。 这 种 系统 存在 数据 表示 及 输 
入 /输出 格式 的 不 匹配 问题 。 第 二 代 综 合 系统 为 紧密 或 松散 集成 的 系统 。 紧 密集 成 的 系统 采 
用 公共 数据 表示 ,所 有 工具 都 使 用 同样 的 过 程 来 访问 。 这 种 系统 效率 很 高 ,但 缺乏 灵活 性 , 因 
为 格式 的 一 点 变化 就 会 影响 到 所 有 的 工具 。 松 散 集 成 的 系统 将 设计 数据 与 工具 分 离 。 数 据 存 
储 在 数据 库 中 ,每 个 工具 只 访问 它 需要 的 信息 ,并 使 用 自己 的 表示 来 处 理 检索 的 信息 [CT89， 
LGP*91,LND*91,RG91]. . 

在 设计 探索 中 ,数据 库 还 支持 同一 个 设计 的 多 种 不 同 版 本 。 这 种 支持 减轻 了 设计 者 管理 
设计 修改 和 配置 的 负担 。 在 系统 数据 库 的 支持 下 ,系统 的 每 个 版 本 及 与 以 前 版 本 不 同 之 处 都 
会 被 记录 下 来 。 在 任何 时 候 都 可 以 放弃 所 做 的 工作 ,回潮 到 任何 一 个 版 本 。 版 本 间 的 不 同 之 
处 可 以 输出 作为 设计 决策 的 文档 。 可 选择 设计 的 不 同 质量 度量 可 以 输出 ,以 帮助 在 设计 间 做 
出 折 中 决策 。 设 计 的 不 同 部 分 可 以 同时 被 多 个 设计 者 修改 ,而 由 数据 库 来 管理 数据 的 一 致 性 。 


9.5 系统 设计 的 概念 化 环境 


从 系统 描述 开始 的 完全 自动 设计 过 程 是 一 个 虽然 目前 还 不 现实 ,但 却 重要 的 目标 。 即 使 
已 拥有 所 有 的 系统 和 芯片 级 工具 ,设计 者 也 需要 熟悉 并 有 信心 去 使 用 它们 。 综 合 工具 在 不 同 
风格 的 设计 中 获得 始终 如 一 的 质量 也 需要 花费 时 间 。 因 此 ,有 必要 提供 一 个 环境 ,使 得 设计 者 
可 以 控制 设计 决策 ,并 采用 手工 设计 来 代替 自动 综合 和 优化 。 即 使 当 综 合算 法 已 很 完美 ,也 要 
允许 设计 者 做 高 层次 决策 ,如 选择 系统 组 件 .实现 风格 ,以 及 约束 。 这 样 ,概念 化 模型 必须 允许 
在 设计 过 程 中 每 一 阶段 对 设计 决策 和 设计 策略 进行 控制 ,这 就 进一步 要 求 环境 在 每 一 个 抽象 
级 别 上 提供 可 用 度量 的 快速 反馈 ,并 允许 设计 者 选择 组 件 拓扑、 实现 风格 .优化 目标 、 成 本 范 数 、 
设计 约束 、 工 艺 映射 和 划分 [BE89,CPTR89， — — | 
YH90,HG91]。 概 念 化 环境 与 系统 和 组 件数 ` 
据 库 协 同 工 作 。 这 些 数 据 库存 储 了 以 往 长 时 
间 里 各 个 版 本 的 设计 数据 ,其 中 概念 化 环境 中 
访问 其 中 很 小 一 部 分 数据 ,用 于 短 时 间 内 的 修 
改 和 细 化 。 概 念 化 环境 可 看 做 设计 者 在 设计 
细 化 过 程 中 用 到 的 一 个 短期 存储 器 (便签 式 存 
储 器 ) 。 概 念 化 模型 ( 见 图 9-12) 包 含 以 下 几 个 
部 分 :设计 管理 器 ,质量 评估 器 、 综 合算 法 、 设 图 9-12 系统 设计 的 概念 化 环境 
计 一 致 性 检验 器 、 显 示 器 和 编辑 希 。 

设计 管理 器 用 于 维护 局 部 设计 数据 ,例如 当前 组 件 的 分 配 和 对 象 的 划分 。 质 量 评估 器 提 
供 设 计 度 量 的 快速 反馈 ,如 第 7 章 所 述 。 综 合算 法 对 设计 做 出 实际 的 改动 。 他 们 可 以 应 用 于 
整个 设计 或 其 中 某 些 部 分 。 设 计 者 应 能 将 综合 分 为 数 个 较 小 步骤 ,对 每 步 分 别 应 用 算法 。 在 
手工 设计 过 程 中 ,综合 工具 可 以 看 作为 设计 者 提供 一 些 提示 。 例 如 ,在 划分 过 程 中 ,设计 者 可 





以 每 次 把 一 个 行为 分 配 到 系统 组 件 上 ,划分 算法 能 给 出 每 个 行为 的 最 佳 映 射 的 建议 ,设计 者 可 
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以 接受 或 拒绝 。 设 计 一 致 性 检查 器 用 于 确定 手工 设计 的 修改 没有 改变 系统 的 功能 。 例 如 , 当 
设计 者 为 了 将 两 个 并 发 行为 映射 到 一 个 串 行 处 理 器 上 ,而 将 其 改 为 顺序 执行 时 ,一 致 性 检验 唤 
必须 保证 这 种 顺序 化 的 行为 和 原来 的 并 行 行为 产生 相同 的 结果 。 

显示 器 和 编辑 器 使 得 设计 数据 能 被 显示 和 编辑 。 这 二 者 都 包含 通常 所 指 的 用 户 界 面 (user 
interface，UI)。UI 是 概念 化 环境 的 一 个 重要 部 分 ,因为 设计 者 只 有 在 多 懂 和 有 用 的 数据 显示 和 
编辑 环境 下 ,才能 有 效 地 使 用 该 工具 。 没 有 一 个 好 的 UL 即使 是 最 好 的 综合 算法 也 发 挥 不 了 作 
用 ,因为 设计 者 无 法 决定 何 时 应 用 这 些 算法 。 对 于 前 面 描述 的 系统 设计 任务 ,一 个 好 的 UL 必须 
以 易于 快速 理解 的 方式 对 总 体 设计 状态 进行 概括 总 结 , 可 作为 设计 文档 ,并 突出 强调 设计 中 需要 
特别 注意 的 部 分 (如 违 肥 约束 )。 总 体 设计 状态 包含 可 执行 描述 、 当 前 已 指派 的 组 件 及 其 连接 性 、 
laa 能 对 象 到 这 些 组 件 的 映射 情况 以 及 对 所 选择 的 质量 度量 的 评估 和 约束 。 

定 总 体 设计 状态 ,设计 者 可 以 对 很 多 途径 进行 探索 。 设 计 者 可 以 对 有 关 评 估 方 式 的 细 
en 如 果 不 同 意 评估 器 所 做 的 假设 , 则 可 以 不 采用 该 评估 。 设 计 者 可 以 修改 约束 ,也 
可 以 修改 设计 状态 的 显示 ,以 关注 于 某 一 部 分 设计 或 某 个 度量 。 设 计 者 还 可 以 手工 执行 诸如 
分 配 .划分 等 设计 任务 ,以 及 要 求 诸如 单个 对 象 的 最 好 可 能 放置 .调度 . 绑 定 等 的 提示 信息 。 

系统 设计 工具 的 用 户 界面 的 一 个 例子 如 图 9-13 所 示 。 其 显示 的 信息 对 应 于 图 9-3 中 框 
图 的 划分 。 映 射 这 一 列 显 示 出 功能 单元 到 所 分 配 的 系统 组 件 的 映射 。 例 如 ,组 件 ASIC 包含 
行为 StoreAudio 和 GenerateAudio。 组 件 类 型 这 一 列 指明 了 每 个 系统 组 件 的 类 型 , 即 系统 组 
件 代表 的 库 组 件 。 从 组 件 库 中 这 个 类 型 可 以 获得 该 组 件 所 有 的 信息 。 例 如 ,系统 组 件 Proces- 


sor 绑 定 到 类 型 为 Y900 的 处 理 器 上 。 余 下 的 几 列 表示 选择 的 质量 度量 。 一 列 中 的 每 一 项 给 


出 了 相应 质量 度量 的 评估 值 和 需要 值 。 成 本 这 一 列 给 出 了 每 个 被 分 配 组 件 的 成 本 。 执 行 时 间 

这 一 列 显示 出 执行 时 间 的 评估 值 。 面 积 和 引 脚 列 则 提供 了 每 个 ASIC 组 件 的 面积 和 引 脚 数 。 

指令 数列 给 出 了 每 个 处 理 器 机 器 指令 数 的 评估 值 。 违 反 约 束 的 情况 用 星 号 标明 。 为 了 简明 起 
见 , 图 中 略 去 了 总 线 和 通道 。 其 他 质量 度量 ( 见 第 7 章 ) 也 可 以 增加 到 显示 中 。 


ae oas ME ma naen 成 本 ET ma sN 指令 数 


系统 
ASICI 16k/20k} 46/60 
StoreAudio 
GenerateAudio 
| ASIC2 18k/20k] 48/60 
StoreGenerate Video 
|} StoreAVCmd 
| Memory! 
audio_array] 
audio_array2 
Memory2 
video_array 6k/5k* 
Processor | 
ProcessRemoteButtons | 
ProcessMiscCmds 7 


Cost: 5.43 | “视图 选择 || 划 分/ 分配 ] | at | 


图 9-13 系统 综合 工具 的 用 户 接 口 
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为 了 加 强 设计 者 的 理解 ,需要 提供 设计 的 其 他 视图 方案 。 这 些 视图 方案 包括 只 选择 一 些 质 


量度 量 来 显示 ,显示 代价 函数 表达 式 的 细节 ,或 者 观察 有 关 如 何 获得 特定 质量 度量 值 的 详细 信息 
等 。 这 些 视图 可 以 保存 到 文件 中 以 用 作 设 计 文 档 。 例 如 ,图 9-14 中 给 出 的 视图 以 图 形 方式 显示 
了 图 9-13 中 受 约束 质量 度量 的 评估 和 约束 。 设 计 者 可 利用 这 些 信息 来 决定 下 一 步 的 设计 看 重 
点 。 例 如 ,图 中 违反 约束 最 主要 的 是 处 理 器 程序 指令 数 。 注 意 到 两 个 ASIC 的 面积 都 接近 组 件 的 
容量 ,设计 者 可 以 选择 更 大 的 程序 存储 器 , 而 不 是 将 行为 从 处 理 需 移动 到 ASIC 上 。 


$ (System) 105/100 
Execution-time(StoreAudio) 100/110 
Execution-time(GenerateAudio) 100/110 
Execution-time(StoreGenerate Video) 100/110 


Execution-time(StoreA VCmd) 100/1 10 
Area(ASIC1) 16000/20000 


Area(ASIC2) 18000/20000 


Pins(ASIC2) 58/60 


Inst Processori ) 6000/5000 





图 9-14 ”可 选 视图 ,只 显示 评估 和 约束 的 关系 


图 9-13 中 还 有 几 个 按钮 ,分 别 用 来 激活 划分 、 分 配 和 细 化 工具 。 划 分 和 分 配 工具 允许 浏 
览 和 选择 库 中 组 件 ,对 其 进行 分 配 ,应 用 自动 划分 和 手工 移动 等 方式 将 功能 对 象 从 一 个 组 件 移 
到 另 一 个 组 件 。 它 还 提供 了 一 些 提示 信息 ,如 第 6 章 讨论 的 各 种 接近 性 准则 的 基础 上 ,给 出 每 
个 功能 对 象 与 选 定 对 象 间 的 接近 性 值 的 一 个 列表 。 细 化 工具 人 允许 选择 通信 协议 和 仲裁 方案 。 

概念 化 环境 允许 使 用 多 种 不 同 的 方法 学 。 设 计 者 应 反复 多 次 处 理 同 一 个 任务 ,直到 满足 
需求 为 止 。 很 显然 ,设计 者 希望 做 出 大 多 数 的 高 层次 决策 ,而 只 手工 对 设计 中 的 小 部 分 进行 综 
合 。 设 计 的 剩余 部 分 都 由 自动 综合 工具 生成 ,这 样 就 不 会 对 设计 者 所 做 的 高 层次 决策 有 太 大 
的 影响 。 

总 之 ,对 于 所 有 设计 者 在 高 抽象 层次 上 所 完成 的 任务 ,概念 化 环境 允许 设计 者 手工 执行 同 
样 的 任务 。 然 而 ,概念 化 环境 还 允许 设计 者 使 用 自动 综合 工具 来 完成 部 分 任务 。 随 着 算法 的 
改进 ,更 多 的 设计 工作 将 可 以 自动 实现 。 

9.6 结论 和 发展 方 向 

这 一 音 里 ,我 们 介绍 了 一 个 三 步 的 设计 方法 学 ,包括 系统 描述 捕获 、 系 统 设计 和 组 件 实现 。 
前 两 步 是 CAD 研究 领域 ,也 是 本 书 的 研究 焦点 。 我 们 定义 了 系统 设计 步骤 中 的 主要 任务 , 讨 
论 了 在 系统 .芯片 .逻辑 和 物理 等 级 别 上 的 设计 和 工具 问题 。 我 们 还 简要 介绍 了 系统 设计 的 文 
持 环 境 ,包括 系统 数据 库 和 用 于 交互 和 自动 综合 的 概念 化 环境 。 未 来 的 研究 领域 包括 如 下 儿 
个 方面 : 





a) 针对 新 硬件 工艺 .实现 方式 和 体系 结构 研究 新 的 评估 方法 。 新 的 评估 算法 必须 能 预测 


软件 和 硬件 优化 技术 的 结 条 。 
b) 引入 形式 验证 技术 ,来 提高 设计 的 正确 性 ,减少 目前 在 模拟 各 阶段 设计 过 程 中 所 需要 
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的 大 量 时 间 。 

c) 在 设计 过 程 中 尽早 引入 可 测试 性 设计 ,并 在 每 个 设计 阶段 进行 可 测试 性 度量 的 计算 。 

d) 必须 开发 相应 的 框架 和 数据 库 来 管理 系统 级 的 工具 和 数据 。 

e) 必须 研究 系统 级 的 转换 技术 并 将 其 加 入 到 现 有 的 设计 任务 中 。 

f) 设计 实现 后 的 质量 度量 必须 反馈 给 设计 过 程 的 高 层次 ,以 支持 设计 和 迭代 反复 。 

g) 用 以 文 持 手 工控 制 综合 过 程 的 交互 式 综合 技术 也 需要 研究 。 

h) 通过 定义 设计 质量 度量 ,并 了 解 设计 风格 结构 拓扑 关系 以 及 设计 方法 学 对 设计 质量 
的 影响 ,会 极 大 地 有 助 于 设计 探索 的 自动 化 。 这 样 ,对 不 同 级 别 上 的 设计 质量 进行 比 
较 分 析 将 是 非常 有 益 的 。 

总 之 ,不 仅 在 算法 研究 方面 ,而 且 在 系统 和 ASIC 综合 所 需 基本 体系 结构 的 开发 方面 ,还 


需要 大 量 的 工作 。 我 们 硕 望 本 书 能 够 作为 这 方面 研究 的 一 个 起 步 。 


9.7 


练习 


1. 说 明 采 用 目 然 语言 进行 系统 功能 描述 的 设计 方法 学 的 局 限 性 。 列 举 采用 可 执行 系统 描述 


语言 的 优 缺 各 及 其 对 方法 学 的 影响 。 
2. 给 出 图 9-6 中 系统 设计 任务 的 一 种 顺序 ,使 所 产生 的 系统 的 组 件 间 连 线 数 最 少 。 


ws) 


. 给 出 一 种 从 系统 描述 开始 进行 系统 综合 的 系统 设计 过 程 , 其 中 的 组 件 只 包括 1 个 处 理 器 芯 


片 和 1 个 存储 器 芯片 。 


~ 人 (Cn 人 


“8. 
"9, 


“10. 


“14. 


. 给 定 功能 描述 所 需 的 总 执行 时 间 ,设计 一 个 算法 ,从 功能 描述 中 选择 最 小 成 本 的 组 件 集合 。 
. 扩展 上 一 题 的 算法 ,产生 形状 函数 ,在 给 定性 能 约束 范围 的 条 件 下 分 配 最 小 成 本 组 件 集合 。 
. 列举 将 通道 划分 到 总 线 的 3 个 成 本 函数 。 

. 设计 一 个 算法 ,将 并 发 行为 调度 到 两 个 处 理 项 上 执行 。 


给 出 一 种 技术 ,在 时 延 约 束 下 顺序 化 并 发 行为 。 

给 出 图 9-8 中 转换 工具 的 需求 。 

列举 系统 设计 过 程 中 需要 设计 者 交互 的 所 有 阶段 。 定 义 需 要 显示 给 设计 者 的 度量 和 设 
计 者 要 输入 的 设计 参数 。 


. 对 图 9-7 中 的 系统 数据 库 ,设计 一 种 一 致 性 检测 方案 。 
. 除 本 章 中 提 到 的 以 外 ,再 定义 几 个 有 用 的 系统 级 转换 方案 。 
. 对 图 9-7 中 的 组 件数 据 库 定义 其 信息 模型 。 给 出 不 同 设计 阶段 数据 库 提供 的 信息 类 型 


和 数据 库 啊 应 的 查询 类 型 。 
对 比 图 9-13 中 的 文本 显示 ,描述 并 示范 一 个 交互 式 划 分 的 图 形 显示 。 当 前 的 划分 如 何 
显示 ? 如何 显示 评估 和 约束 ?设计 者 如 何 分 配 组 件 和 移动 对 象 ? 


“15. 设计 一 种 技术 ,在 系统 或 ASIC 综合 中 采用 真实 实现 的 度量 ,以 此 来 支持 综合 和 实现 间 


的 设计 反复 。 


**16. 设计 一 种 方法 ,将 详细 时 延 信 息 结合 进 系统 综合 中 。 
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本 节 收 录 了 在 第 4 章 中 出 现 的 电话 应 答 机 控制 器 的 自然 语言 功能 描述 。 控 制 器 的 Spec- 
Charts 形式 的 系统 描述 就 是 从 这 个 描述 中 直接 产生 的 。 为 了 便于 引用 ,我 们 将 每 一 句 描述 编 
号 。 控 制 器 的 环境 和 接口 已 经 在 4.2 市 的 图 4-1 中 给 出 。 


对 外 部 按键 和 开关 的 响应 


1. 当 “power” 开 关 处 于 “off” 位 置 时 ,机 器 忽略 对 电话 线 和 所 有 的 按键 响应 。 

2. 当 为 “on” 时 ,显示 模块 显示 当前 的 信息 数 , 初 始 为 0。 

3. 按 下 “play-messages 按键 将 播放 所 有 的 消息 。 

4. 常见 的 录音 机 按键 都 有 :播放 play, 快 进 forward, 快 退 rewind 和 停止 stop; 按 下 任何 一 
个 都 将 使 当前 的 信息 计数 归 零 。 

5. 按 下 “record — announcement”" 按 键 将 触发 一 声 蜂 鸣 , 几 秒 钟 后 还 有 一 声 蜂 鸣 。 

6. 在 两 声 蜂 鸣 之 间 通 过 麦克 风 录 制 的 任何 声音 都 将 成 为 预 录 的 通知 。 

7. 按 下 “play — announcement” 按键 就 能 听 到 通知 。 

8. 按 下 并 保持 “memo” 按 键 将 允许 用 户 通过 外 部 的 麦克 风 来 录制 一 段 消息 。 

9. 按键 松 开 时 消息 录制 中 止 。 

10. 因此 “memo” 按 键 对 其 他 家 庭 成 员 留 言 是 有 用 的 。 


对 电话 线 的 啊 应 


A. 监测 线路 上 的 响 铃 | 

11.“onvoff”" 按 键 用 于 将 机 器 从 * 开 ”状态 置 为 “ 关 ” 状 态 ,或 者 相反 。( 当 机 器 处 于 "off , 控 
制 器 不 能 响应 呼叫 ,然而 当 *power” 为 “off" 时 ,控制 器 将 不 能 对 任何 的 输入 产生 啊 应 。) 

12. 当 为 “on" 时 ,显示 消息 数目 的 模块 下 方 的 发 光 二 极 管 被 点 亮 。 

13. 当 为 “on” 时 ,机 器 一 般 在 啊 铃 四 次 后 应 管 。 

14. Ait, wR“ tollsaver” 为 “on” 且 至 少 记 录 了 一 条 信息 ， 则 机 器 在 铃 响 两 声 后 应 管 。 

15. Tollsaver 允许 机 主 通过 电话 来 判断 是 否 有 信息 记录 下 来 。 

16. 如 果 电 话 铃 响 三 次 , 则 说 明 没 有 信息 记录 ,机 主 可 以 挂 断 , 这 样 就 避免 了 长 途 通话 费用 。 

17. 有 时 机 主 在 离开 寓所 之 前 可 能 会 忘记 打开 机 硕 。 

18. 因此 ,即使 是 处 于 “off” ,机 器 也 将 在 响 铃 十 五 次 之 后 应 答 。 

19. 因此 机 主 可 以 按 下 面 的 方式 来 远程 打开 机 二。 


B. 正常 的 应 答 活动 
20. 一 旦 机 器 响应 来 电 则 会 播放 通知 。 


21. 当 通 知 播放 完毕 ,会 自动 响起 一 声 蜂 鸣 ,同时 来 电线 路 上 的 信息 开始 被 记录 下 来 直到 


呼叫 者 挂 断 或 者 超过 最 大 的 消息 时 间 。 
22. 机 器 再 次 挂 起 并 监测 啊 铃 。 


ON 
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23. 如 采 在 播放 通知 的 过 程 中 挂 断 , 则 机 器 立即 挂 起 并 且 不 进行 消息 的 录制 。 
24. 如 采 在 播放 通知 或 者 录制 信息 的 过 程 中 用 拨号 音 1, 则 机 器 立即 进入 远程 操作 模式 。 


C. 远程 操作 的 应 答 活动 

25. 远程 操作 模式 的 第 一 步 就 是 检查 用 户 的 身份 号 码 。 

26. 接 下 来 的 四 次 按键 音 的 数字 将 送 入 机 器 和 内 部 存储 的 四 位 号 码 进行 比较 。 

27. WRA IAE, WELASE HE hE 

28. 如 果 确 实 匹配 ,机 器 进入 基 本 命令 basic-commands 模式 ,在 该 模式 下 它 可 以 被 指示 执 
行 几 个 基本 命令 。 

29. R5 2 将 播放 所 有 的 消息 。 

30. KS 3 到 6 对 应 标准 的 录音 机 按键 :播放 play, 快 进 forward, 快 退 rewind 和 停止 stop. 

31. 拨号 7 将 触发 蜂 鸣 , 蜂 鸣 的 数量 代表 录制 的 信息 数 。 

32. 拨号 8 将 指示 机 器 离开 基本 命令 模式 进入 复杂 命令 miscellaneous-commands 模式 。 

33. 在 该 模式 下 ,拨号 3 将 清除 "erases "所 有 录制 的 信息 , 即 快 退 到 录音 开始 ,并 且 设 置 消 
息 计 数 为 0。 

34. 拨号 4 将 播放 通知 。 

35. 拨号 5 和 按 下 "record-announcement 按键 一 样 。 

36. 拨号 6 将 设 定 机 器 的 开关 状态 在 挂 断 之 后 从 "off 变 为 “on ”或 者 相反 。 

37. 拨号 2 将 指示 机 器 回 到 基本 命令 模式 。 

38. 在 上 述 两 种 命令 模式 的 任 一 种 发 生 挂 斯 ,磁带 都 将 重 置 到 最 后 一 条 信息 的 结尾 , 即 任 
何 已 经 录制 的 信息 都 将 保留 。 

39. 在 基本 命令 模式 时 拨号 9 也 将 触发 这 种 复位 。 

40. 在 复位 后 或 者 在 检测 用 户 身份 号 码 时 呼叫 方 挂机 ,机 器 都 将 进入 挂 起 状态 。 


> 
~] 


0 


复杂 需求 
41. 如 果 在 机 器 应 答 之 后 “onvoff 键 被 按 下 ,任何 当前 的 活动 都 将 中 止 ,同时 机 器 将 如 前 
所 述 监测 电话 线 。 


42. 该 功能 用 于 屏蔽 呼叫 ,机 主 可 以 监听 消息 并 且 随 时 拿 起 电话 按 下 “onvoff" 键 将 应 答 
置 为 “off" 状 态 , 同 时 开始 和 呼叫 者 通话 。 
43. 在 机 器 应 答 电 话 的 时 候 应 答 机 的 按键 具有 优先 权 ; 因 此 , 按 下 任何 外 置 按键 都 将 中 断 
当前 的 活动 。 
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一 AnSwering machine controller 
一 一 本 站 水 本 本 本 本 本 水 本 本 本 本 本本 让 事主 本 本 本 本 本 本 本 本 本 本 本 本 让 本 本 本 本 本 本 本 本 本 本 本 李宁 本 让 本 本 率 率 


entity ansE is 


port ( 

--Interface to line circuitry 

hangup.p : in bit; 一 hangup detected 

offhook-p : out bit; --answers 

produce.beepp : out bit; ~-produces a beep 

ring-p =: in bit; -~ring detected 

tone.p : in bit.vector (3 downto 0); --binary tone 
-~Interface to display 

nummsgs_p : out integer range 0 to 31; -~msgs display 
on.light.p : out bit; --turns on led 
—Touch--sensitive buttons 

but_twd_p : in bit; -~forward tape 

but-hear.anmnp : in bit; --play pre--recorded announcement 
but.on.off_p : in bit; -~toggle machine-—on state 
but.memo_p : in bit; --record message via microphone 
but.play.msgs-_p : in bit; -~play all messages 

but_play_p : in bit; -~-play tape from curr position 
but_rec_ann_p >: in bit; -~record a new announcement 
but.rew_p : in bit; --rewind tape 

but-stop.p : din bit; 一 Stop tape 

--Switches 

power_p : in bit; --power switch 

tollsaver_p : in bit; --answer after 2 rings if msg 


一 Interface to announcement player 7 

ann.done.p : in bit; --end of announcement reached 
ann_play_p : out bit; --~plays announcement 
ann_rec.p : out bit; --records announcement 
-—-Interface to tape player 


tapetudp : out bit; --forwards tape 
tape_play_p : out bit; --plays tape 
tape-_rew_p : out bit; --rewinds tape 
tape.recp : out bit; --records on tape 
tape.count_p : in integer 一 tape position, start is 0 
); 
end; 


architecture anså of ansE is 
begin 


behavior ans type concurrent substates is 
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一 Global declarations 

type four_buttons.type is array (1 to 4) of bit.vector(3 downto 0); 
Signal user.code four_buttons_type; -user id number 
signal machine.on bit; --current state of machine 

signal machineontoggle : bit; --toggle on hangup 

signal nummsgs : integer range 0 to 31; --num of messages 
signal any-buttonpushed : bit; --1 if machine button pushed 


begin 


Main: ; 
MachineOnToggler : ; 
ConcAsgnsi : ; 
ConcAsgns2 : ; 


me pk kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkt** 
behavior Main type sequential substates is 
——kkkkkkkkkkkktkkkkkkkkkkkkřkřktkkkkk*k**** 

—-main control behavior of the answering machine controller 
--Terminates any tape player, announcement player, or beep 
~~activity. Useful after exceptions such as hangup. 


procedure TerminateAnyActivity is 


begin 
produce.beep.p <= ’0’; 
ann.rec.p <= 70’; 
ann_play_p <= °0’; 
tape.twd_p <= '0’; 
tape_play.p <= 70’; 
taperew_p <= 0’; 
taperec.p <= '0’; 

end; 


--Produces a beep with the indicated length 
procedure Beep (len : in time) is 
begin 
produce_beep-p <= 71’; 
wait for len; 
produce.beep-p <= ’0’; 
end; 


begin 
SystemOff : (TI, powerp = ’1’, System0n); 
SystemOn : (TI, powerp = ’0’, System0ff); 


behavior System0ff type code is 
begin 
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TerminateAnyActivity; 
on-light.p <= ’0’; 一 tura off led 
end Systen0ff; 


behavior SystemOn type sequential substates is 


Signal terminal.tape_count: integer; --end of last message 
Signal toggle.onhangup : bit; --toggle machine——-on state 


--Plays all messages by saving tape count of end of last 
~-message, rewinding to start of tape, and playing until . 
一 end tape count. 
procedure PlayAllMsgs 
(signal terminaltape-count : inout integer ; 

signal tape_count : in integer ; 

Signal tape_rew : out bit ; 

signal tape.play : out bit ) is 

begin 
--Save tape count of end of last message 
terminaltape.count <= tape-_count-p; 
--Rewind to start of tape 
taperew <= 1’; 
if not (tape_conunt = 0) then 
wait until tape_count = 0; 
end if; 
taperew <= 70’; 
一 Play until end of last message 
tapeplay <= °’1’; 
if (tape.count < terminal_tape.count) then 
wait until tape.count = terminaltape-count ; 
end if; 
tape.play <= ’0’; 
—-Beep to indicate that all messages have been played 
Beep(1 s); 
end; ~~PlayAllMsgs 


begin 


InitializeSystem : 
(TOC, true, RespondToLine) ; 
RespondToLine : 
(TI, any-button-pushed = ’1’ 
and any-button-_pushed’event, 
RespondToMachineButton) ; 
RespondToMachineButton : 
(TOC, true, RespondToLine), 
(TI, any-button_pushed = ’1’ 
and any-button_pushed’event, 
RespondToMachineButton) ; 
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—-Rewinds to beginning of tape, sets message number to 0 
behavior InitializeSystem type code is 
begin 
nummsgs <= 0; 
taperewp <= ‘1’; 
if (tape.count_p /= 0) then 
wait until tape.countp = 0; 
end if; 
tape.rewp <= ’0’; 
toggle.on_hangup <= ’0’; 
end InitializeSystem; 


—Monitor and answer line as opposed to handling 
—machine buttons 


behavior RespondToLine type sequential substates is 
begin 


Monitor : 

(TOC, true, Answer), 

(TI, hangup-p = ’1’ and hangup-p’event, Monitor); 
Answer : 


(TOC, true, Monitor), 
(TI, machine.on = ’'’0’ and machine_on’event, Monitor); 


一 Monitors line for required number of rings 

一 If the machine is off, it answers after 15 rings 
—(just in case the owner forgot to turn the machine 
--on before leaving home). 

一 It the machine is on, it answers after 4 rings, 

一 UNLESS tollsaver is on and there is a message, in 
--which case it answers after 2 rings. 


sip 


behavior Monitor type code is 


variable rings.tosait: integer range 1 to 20; 
variable i: integer range 0 to 20; 


一 Computes the number of rings to wait for 
function DetermineRingsToWait return integer is 
begin 
if ((nummsgs > 0) and (tollsaver_p = ’1’) and 
(machine.on = ’1’)) then 
return(2); 
elsif (machine.on = ’1’) then 
return (4); 
else 
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return(15); 
end if; 
end; 


begin 

TerminateAnyActivity; 

--Turn on led if machine is on 

if (machine.on=’1’) then 
ontlight-p <= ’1’; 

else 
onlight_p <= ’0’; 

end if; 


rings.towait := DetermineRingsToWait; 
i := 0; 
-~Loop until required rings have been detected 
while (i < rings.to.wait) loop 
wait on tollsaver_p,machine_on,ring-p; 
if ring-p = ?1’ and ring-p’event then 
i := i+ 1; 
end if; | 
~~If machine.on or tollsaver has changed, the 
-~number of rings to wait may also change, 
-~so let’s recompute 
if (machine.on’event or tollsaver_p’event) then 
rings.to.wait := DetermineRingsToWait; 
end if; 
end loop ; 
offhook.p <= ’1’; ~-answer the line 
end Monitor; 


--Answers the line. 

-—-Normal sequence: PlayAnnouncement, RecordMsg, Hangup. 
—If a hangup is detected while playing or recording, 
--machine hangs up. 

--If tone 1 is detected, enters remote operation mode. 
behavior Answer type sequential substates is 

begin 


PlayAnnouncement : 
(TI, tone.p = "0001", RemoteOperation), 
(TI, hangup-p = ’1’ and hangup_p’event, HANGUP), 
(TOC, true, RecordMsg) ; 
RecordMsg : 
(TI, tone.p = "0001", RemoteOperation), 
(TOC, true, Hangup); 
Hangup : 
(TOC, true, stop); 
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RemoteOperation : 
(TOC, true, HANGUP); 


--Plays announcement until end of announcement 
behavior PlayAnnouncement type code is 
begin 
annplay.p <= °’1’; 
wait until anndone.p = ’1’; 
ann.play.p <= ’70’; 
end PlayAnnouncement ; 


~-Produces a beep, then records line until hangup or 
--until a maximum time is reached. 
-~Places a beep at the end of the recorded message. 
behavior RecordMsg type code is 
begin 
Beep(1 s); 
taperec.p <= ‘1’; 
if not (hangupp = ’1’) then 
wait until hangup.p = ’1’ for 1000 s; 
Beep(1 s); 
nummsgs <= hummsgs + 1; 
end if; 
taperecp <= ’0’; 
end RecordMsg; 


~-Hangs up. Toggles machine-—on state if necessary 
behavior Hangup type code is 
begin 
offhookp <= 70’; 
ann.play._p <= ’0’; 
if (toggleon hangup = ’1’) then 
toggle.on-hangup <= ’0’; 
machine.on_toggle <= ’1’; 
wait for i s; 
machine on-toggle <= ’0’; 
end if; 
end Hangup; 


--Processes remote commands given by machine owner if 
--correct user identification number is entered 


behavior RemoteOQperation type sequential substates is 
signal codeok : bit; -~true if correct id 
begin 


CheckUserId : 
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(TOC, code.ok 
(TOC, code_ok 
(TI, hangup.p 
RespondToCmds : 
(TOC, true, stop); 


’1?, RespondToCmds), 
0’ stop), 
?1’, stop); 


~~Checks next four button--tones against user id, 
“-sets code.ok to true if all four match 
behavior CheckUserId type code is 
variable entered.code: four_buttons_type; 
variable i: integer range 1 to 5; 
begin 
TerminateAnyActivity; 
code.ok <= ?1?; 
i := 1; 
while i <= 4 loop 
wait until tonep /= "1111" and tone_p’ event; 
if (tone 了 了 /= user.code(i)) then --wrong 
code.ok <= °0’; 
end if; 
i := i + 1; 
end loop ; 
end CheckUserId; 


~-Processes user commands. When done with 
--commands, resets tape to end of last message, 
--unless of course the user has erased all 


~-messages. HearMsgsCmds is the initial mode 
--which allows commands related simply to hearing 
—-messages. If tone="0010" is detected, enters 


--MiscCmds, in which miscellaneous, more advanced 
—commands related to machine maintenance 

一 Can be applied. 

behavior RespondToCmds type sequential substates 
is begin 


HearMsgsCmds : 

(TOC, true, MiscCmds), 

(TI, hangup-p = ’1’, ResetTape); 
MiscCmds : 

(TOC, tone-p = "0010", HearMsgsCmds), 

(TOC, other, ResetTape), 

(TI, hangup-p = ’1’, ResetTape); 
ResetTape : 

(TOC, true, stop); 


——Normal command processing mode. All conman 
-~related to hearing messages can be applied. 
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behavior HearMsgsCmds type code is 
variable i: integer; 
begin 


if (tonep = "1111") then 
wait until tone.p /= "1111"; 
end if; 


tape_play.p <= ’0’; 
tapetwdp <= ’0’; 
taperewp <= ’0’; 
—-"1000" enters MiscCmds 
if (tone.p /= "1000") then 
case (tone_p) is 
when "0010" => --play all messages 
PlayAllMsgs (terminal tape.count, 
tape.countp, 
tape_rew.p,tape_play-p) ; 
when "0011" => --play tape 
tape.playp <= ’1°; 
when "0100" => -~forward tape 
tapetudp <= ‘1’; 
when "0101" => --rewind tape to start 
taperew.p <= ‘1’; 
if (tape_count 了 /= 0) then 
wait until tapecount.p = 0; 
end if; | 
tape.rew.p <= ’0’; 
when "0110" => --stop tape 
tape_play.p <= “0 ; 
tapetwd.p <= °0’; 
taperewp <= ’0’; 
when "0111" => --beep number messages 
wait for 5 s; 
i := 0; 
--one beep / msg 
while (i < nummsgs) loop 
Beep(1 s); 
wait for is; 


i := i+ 1; 
end loop ; 
when others => 
end case; 
end if; 


end HearMsgsCmds; 


~-In this mode the user can perform less 
~-common commands related to machine 
—-maintenance. 
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behavior MiscCmds type code is 
begin 
~-Indicate new mode with a beep 
Beep(1 s); 
Loop 
wait until tone_p /= "1111" 
and tone.p’event; 
case (tone_p) is 
when "0010" => --exit MiscCmds mode 
exit; --exit loop 
when "0011" => --rewind tape 
taperew.p <= ’1’; 
if not (tape.count.p = 0) then 
wait until tape.count.p = 0; 
end if; 
tape.rev.p <= ’70’; 
terminaltape.count <= 0; 
when "0100" => -~hear announcement 
annplayp <= ’1’; | 
wait until anndone_p = ’i’; 
ann-playp <= 70’; 
when "0101" => --record announcement 
—-preparation time 
wait for 50 s; 
~ 一 beep indicates start 
Beep(1 s); 
wait for 0 s; 
--record for full length 
amn.rec._p <= ‘17; 
wait until ann.done_p = ’1’; 


amn.rec.p <= ’0’; 
--beep indicates end 
Beep(1 s); 


when "0110" => --toggle mach--on stat 


toggle.onhangup <= ’1’; 
when others => 
end case; 
end loop; 
end MiscCmds; 


-—-Reset tape to end of last message. 
-~-Rewinds if past end, forwards if before end. 
behavior ResetTape type code is 
variable tape.count: integer; 
begin 
if (tape.count_p > terminal.tape_count) then 
taperewp <= ‘1’; 
wait until 
(tapecount_p<=terminal_tape_count) ; 
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taperewp <= ’0’; 
elsif (tape_count_p<terminal_tape.count) then 
tapetudp <= 1’; 
wait until 
(tape_count_p>=terminal_tape_count) ; 
tape.fwdp <= ’0’; 
end if; 
end ResetTape; 
end RespondToCmds ; 
end RemoteOperation; 
end Answer; 
end RespondToLine; 


~-Processes command indicated by a button being pressed 
一 On the machine. | | 
behavior RespondToMachineButton type code is 


procedure HandlePlayPushed is 
begin 
tapeplayp <= ’1’; 
nummsgs <= 0; 
end ; 


procedure HandleFwdPushed is 
begin 
tapetwdp <= ’1°; 
nummsgs <= 0; 
end ; 


procedure HandleRewPushed is 
begin 
nummsgs <= 0; 
tapetrewp <= ‘1’; 
if (tape.count.p /= 0) then 
wait until tape-count._p = 0; 
end if; 
tape.rew_p <= ’0’; 
end ; 


procedure HandleMemoPushed is --record message via mic. 
begin 

Beep(1 s); 

tape.recp <= ’1’; 

Wait until but.memo_p = ’0’ for 1000 s; 

Beep(1 £); 

nummsgs <= nummsgs + 1; 

taperecp <= ’0’; 
end ; 


procedure HandieStopPushed is 
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begin 
nummsgs <= 0; 
tape_playp <= ’0’; 
tapetwdp <= °0’; 
taperew.p <= ’0’; 
tape.rec.p <= ’0’; 
end ; 


procedure HandleHearAnnPushed is ~-play announcement 
begin 

ann.play.p <= ’1’; 

wait until ann.done.p = ’1’; 

ann.play.p <= ’0’; 
end ; 


procedure HandleRecAnnPushed is --record announcement 
begin 

wait for 50 s; 

Beep(1i s); 

wait for 0 s; 

amn.recp <= 71’; 

wait until ann.done_p = ’1’; 

amn.rec.p <= '0’; 

Beep(1 s); 
end ; 


procedure HandlePlayMsgsPushed is -~play all msgs 
begin 
terminaltape.count <= tape.count.p; 
taperew.p <= ‘1’; 
if not (tape.count._p = 0) then 
wait until tape-count_p = 0; 
end if; 
taperewp <= ’0’; 
tape_play.p <= “1 ; 
if (tape.countp < terminaltape.count) then 
wait until tape.count_p = terminal_tape.count; 
end if; 
tape_play-p <= ’0’; 
end ; 


begin --RespondToMachineButton 


if (but_play-p=’1’) then 
HandlePlayPushed ; 
elsif (but fwdp='’1’) then 
HandleFwdPushed ; 
elsif (but_rew.p=’1’) then 
HandleRewPushed; 
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elsif (but_memo.p=’1’) then 
HandleMemoPushed; 
elsif (but-stop_p=’1’) then 
HandleStopPushed; 
elsif (but-hear_ann_p='’1’) then 
HandleHearAnnPushed ; 
elsif (but_rec_ann_p=’1’) then 
HandleRecAnnPushed; 
elsif (but_play.msgs_p=’1’) then 
HandlePlayMsgsPushed; 
end if; 
end RespondToMachineButton; 
end System0n; 


end Main; 


behavior MachineOnToggler type code is 
begin 

machine.on <= ’0’; 

loop 


wait until but_onoff 了 = ’1’ or machine.on_toggle = ’1’ 


if machine.on = ?0?’ then 
machine.on <= ?’1?; 
else 
machine.on <= ’0’; 
end if; 
end loop ; 
end MachineOnToggler; 





--Sets any-button_pushed to 1 if any machine button is pushed. 


behavior ConcAsgnsi type code is 
begin 
loop 


wait on but_play_p, but_fwd_p, but_rew_p, but_memo_p, but.stopp, 


but_hear_ann_p, but_rec_ann_p, but_playmsgs-p; 
if (but.play.p = ’1’ and but-play-p’event) or 
(but.fwdp = ’1’ and but-fwdp'event) or 
(but_rew.p = ’1’ and but_rew_p’event) or 
(but_memo._p = ’1’ and but.memo_p’event) or 
(but.stop_p = ’1’ and but_stop_p’event) or 


(but_hear ann.p = ’1’ and but-hear_ann.p’event) or 


(but-rec_ann_p = ’1’ and but_rec.ann_p’event) or 


(but-play-msgs_p = :1 and but-play-msgs_p’event) then 


any.button_pushed <= 71’; 
else 
any-button.pushed <= ’0’; 
end if; 
end loop ; 
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end ConcAsgnsi; 


~-Updates num.msgs-p port with current value of internal signal 
—-nummsgs so that numerical display shows number of messages. 


behavior ConcAsgns2 type code is 
begin 
Loop 
wait on nummsgs; 
if (nummsgs’event) then 
nummsgs_p <= nummsgs; 
end if; 
end loop ; 
end ConcAsgns2; 


end ans; 
end ansA; 
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术语 解释 


abstraction level (抽象 级 别 ) 一 一 概念 模型 与 系统 描述 中 的 详细 实现 程度 。 实 现 越 详 细 , 抽 象 
级 别 越 低 。 

allocation (分 配 ) 一 一 (动词 ) 在 设计 中 增加 一 个 新 系统 组 件 (譬如 一 个 ASIC) 的 动作 。( 名 词 ) 
设计 中 的 系统 组 件 的 集合 。( 术 语 “ 分 配 ” 在 高 层次 综合 领域 中 也 很 常用 ,表示 在 一 个 设计 中 
增加 一 个 寄存 胡 级 元 件 。) 

Application-Specific Integrated Circuit (ASIC) 一 一 (专用 集成 电路 ) 实 现 数字 功能 的 全 定制 设 
计 的 芯片 。 

behavior (行为 ) 一 一 一 部 分 系统 功能 , 比 一 个 算术 运算 更 复杂 。 

capture-and-simulate (捕获 - 模拟 ) 一 一 一 种 设计 方法 ,首先 实现 系统 ,再 对 其 进行 信息 捕获 ， 
形成 寄存 器 传输 级 或 门 级 网 表 , 然 后 对 其 模拟 ,验证 功能 是 否 正确 。 

channel (通道 ) 一 一 在 两 个 并 发 行为 之 间 的 抽象 通信 媒介 ,在 其 中 进行 数据 传输 。 

closeness (接近 性 ) 一 一 以 一 个 或 多 个 度量 形式 表示 的 划分 过 程 中 两 个 对 象 结 群 的 期 望 值 数 。 

component( 组 件 ) 一 一 实现 功能 的 一 个 物理 对 象 。 

constraint( 约束 ) 一 一 给 定 度量 的 最 大 或 最 小 值 。 

cost (成 本 ) 一 个 目标 函数 的 返回 值 , 表 示 给 定 设 计 的 期 望 值 。 参 见 monetary cost. 

describe-and-synthesize (描述 -综合 ) 一 一 一 种 设计 方法 ,首先 描述 系统 ,作为 可 执行 规范 化 描 
述 ,经 过 模拟 验证 其 功能 的 正确 性 ,然后 对 其 进行 实现 ,或 者 用 手工 ,或 者 用 综合 工具 。 

description( 描述 ) 参见 specification. 

design (设计 ) 一 一 (名 词 ) 实 现 系统 的 部 分 功能 或 所 有 功能 的 结构 。( 动 词 ) 在 系统 中 增加 结构 
的 活动 。 

designer( 设 计 者 ) 一 一 进行 系统 设计 的 人 。 

estimation( 评 估 ) 一 一 其 功能 尚未 完全 实现 时 ,估计 其 设计 的 计算 度量 值 ,也 许 只 是 部 分 实现 。 

executable language( 可 执行 语言 ) 一 一 计算 机 可 读 的 日 可 模拟 的 语言 。 

functional object( 功 能 对 象 ) 一 个 可 实现 的 系统 规范 描述 中 的 变量 ,行为 或 者 通道 。 

functional partitioning( 功 能 划分 ) 划分 系统 组 件 中 功能 对 象 的 动作 。 

implement ( 实现 ) 创建 执行 给 定 功能 的 结构 的 动作 。 有 时 也 指 执行 一 个 给 定 功 能 的 结构 
的 动作 ,例如 ,用 ALU 实现 算术 运算 。 

implementation( 实 现 ) 一 一 在 适合 于 制造 的 一 个 详细 的 级 别 完 全 实现 一 个 系统 的 功能 的 结构 。 

interface process( 接 口 进程 ) 一 一 在 不 相 容 的 通信 行为 的 协议 之 间 完 成 数据 传输 的 一 个 行为 。 

‘high-level synthesis (高 层次 综合 ) 一 一 把 一 个 ASIC 可 执行 规范 描述 转换 到 寄存 器 传输 级 结构 
的 动作 ,包括 3 个 任务 :调度 、 分 配 和 绑 定 。 这 些 任 务 可 以 部 分 或 完全 自动 实现 。 

metric( 度 量 ) 一 一 用 来 评价 一 个 实现 的 质量 或 期 望 值 的 参数 。 

modeler( 建 模 者 ) 一 一 其 任务 为 编写 可 执行 规范 描述 的 人 。 

monetary cost( 费 用 ) 一 一 一 个 实现 的 成 本 价格 。 


natural language( 自然 语言 ) 一 一 口语 语言 。 
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objective function( 目标 函数 ) 评价 一 个 设计 的 期 望 值 的 函数 ,基于 质量 的 度量 和 约束 。 

partition( 划分 ) 一 一 (名 词 ) 把 对 象 分 成 若干 组 。 

partitioning( 划分 ) (动词 ) 把 各 个 对 象 由 对 象 集合 分 成 若干 组 的 动作 。 

process( 进程 ) 一 一 与 其 他 行为 并 发 执行 的 行为 。 

processor (Xb FEE ) 通过 状态 集合 顺序 执行 的 实现 功能 的 系统 组 件 , 其 中 每 个 状态 中 设置 
控制 线 的 值 ,控制 数据 通路 的 数据 传播 ,从 而 实现 所 要 求 的 计算 。 该 组 件 可 以 是 标准 的 ,可 
购买 现货 的 处 理 器 ,如 Intel 8086 ,也 可 以 是 定制 设计 的 。 

protocol ( 协议 ) 一 一 详细 指定 数据 传输 顺序 和 控制 一 个 固定 连 线 集合 上 的 信号 流 的 通信 。 

RT component (寄存 器 传输 级 元 件 ) 一 一 实现 寄存 器 传输 级 功能 的 物理 对 象 ,如 ALU it Beat 
BY Ay FFF 0 | 

selection( 选 择 ) 一 一 在 设计 中 增加 一 个 新 的 寄存 器 传输 级 元 件 , 如 ALU, 

specification (系统 描述 ) 对 所 期 望 的 系统 功能 编写 的 描述 。 自 然 语言 系统 描述 用 人 们 的 
口头 语言 来 描述 。 可 执行 系统 描述 用 形式 化 的 、 机 器 可 读 的 语言 描述 , 它 可 以 被 模拟 , 以 便 
验证 其 功能 。 

standard component( 标 准 元 件 ) 一 一 预先 设计 的 市 场 上 出 售 的 元 件 , 有 固定 的 功能 和 接口 。 

standard language( 标 准 场 言 ) 一 一 一 种 可 执行 的 语言 ,通用 ,并 有 工具 支持 。 

structural partitioning( 结 构 划 分 ) 一 一 将 系统 的 组 件 划 分 为 结构 组 件 的 动作 。 

structure( 结构 ) 组 件 的 互联 。 

system ( 系统) 一 一 包括 输入 和 输出 的 集合 和 功能 描述 ,或 者 再 加 上 实现 功能 的 组 件 。 功 能 描 
述 由 一 个 或 多 个 算法 组 成 , 比 算 术 运 算 更 复杂 。 

system component( 系统 组 件 ) 一 一 实现 系统 级 功能 的 物理 对 象 ,如 ASIC Ab BE Se AE A ao 

system design (系统 设计 ) 一 一 一 种 活动 :分 配 系 统 组 件 , 在 这 些 组 件 中 划分 系统 功能 ,并 定义 
每 个 组 件 的 功能 ,以 便 实 现 系统 功能 。 

system functionality (系统 功能 ) 一 一 系统 完整 的 作用 ,系统 的 输出 定义 为 其 输入 和 时 间 的 
PRI RX o | 























RR 





S| 


索引 中 的 页 码 为 英文 原 书 页 码 , 与 书 中 边栏 标注 的 页 码 一 致 。 


A 
Abstraction levels( 抽 象 级 别 ),1,4~6,63,66,71 
gate( 门 级 ),5,7 
processor (Ab FH 45 & ) , 5 
register( 寄存器 级 ) ,5,7 
structure( 结构 级 ) ,178 
tasks( 任 务 级 ) ,178 
transistor( 蝇 体 管 级 ),4 
Allocation( 分 配 ),8,12,171,180,225,381,387 
Allocation, functional-units, see Functional-unit selection 
(功能 单元 分 配 , 参 见 functional-unit selection) 
Answering machine( 应 答 机 ),118,138 ,140 
Aparty( 一 种 设计 系统 ),209,300 
Arbitration( 仲裁 ) 
models( 仲裁 模型 , 330 
process genetation{ 仲裁 进程 生成 ),333 
schemes( 仲裁 模式 ) ,332 
Architecture( 体 系 结构 ),18,19 
application-specific architecture( 专用 体系 结构 ),47 
controller( 控 制 器 ),47 
datapath ( SH E BR ) ,48 
FSMD( 带 数据 通路 的 有 限 状 态 机 ),50 
general-purpose processor( 通 用 处 理 器 ),51 
CISC( 复 杂 指 令 集 计算 机 ),51 
RISC( 精 简 指令 集 计算 机 ),53 
vector machine( 问 量 机 ),55 
VLIW( 超 长 指令 字 计 算 机 ),56 
parallel processor( F# 47 Xb HE 8 ) ,58 
array processors( MEY Ah HERE ) , 58 
MIMD( 多 指令 流 多 数据 流 计算 机 ),58,59 
multiprocessor system( 多 人 处理 髓 系统 ),59 
SIMD( 单 指令 流 多 数据 流 计算 机 ),58 
Area( 面积 ),238,274,282,298,302 
Argos( 一 种 图 形 同 步 语言 ),99 
B 
Basicblock( 基 本 块 ),6,266,303 
Behavior( 行 为 ),65,165 
leaf( 叶 行为 ),105,122 
Behavioral decomposition, see Hierarchy，behavioral( 行 为 





分 解 , 参 见 Hierarchy, behavioral) 
Binary constraint search( 二 分 约束 搜索 ) ,217 
Binding( 绑 定 ),8,279,335 
Bitrate( 位 传输 率 ) ,244,272 
Block diagram( 框 图 ) , 10,32,377 
Branch probability( 分 支 概率 ),269 
BUD( 一 种 系统 设计 系统 ),205,298 
Bus( 总 线 ),313,355 
arbiter( 总 线 仲裁 器 ),355 
generation( 总 线 生 成 ),315,323 
master( (2% + dig) , 355 
protocol, see Protocol( 总 线 协议 ,参见 Protocol) 
rate( 总 线 速率 ) , 314,316 ~ 319, 322 
selection( 总 线 选 择 ) , 359 
slave( ZK M sit), 355 
width SR BEBE) , 314, 318 ~ 320, 322,326 
C 
Capture-and-simulate(4# 3K — HEH) , 6,9, 384, 386 
CCD(component-connectivity diagram) (28 4434 214 ) , 32 
CDFG (control/data flow graph)( 控 制 / 数 据 流 图 ) , 36 
CFG(control flow graph) (控制 流 图 ) ,31 
Channel( 通 道 ),78,95,152,155,244,272,288,314 
accesses( 通 道 访问 ),314 
average rate( 通 道 平均 速率 ),314,316,318 
identification lines( 通 道 标志 线 ) ,326 ,327 
peak rate( 通 道 最 高 速率 ) ,314,318 
size( 通 道 大 小 ) ,314 
CHOP( 一 种 系统 设计 技术 ),213 
CISC(complex-instruction-set computer ) (复杂 指令 集 计 
算 机 ),51 
Clique partitioning( 团 划分 ),275 
Clock cycle( 时 钟 周期 ) ,241 ,251,299,302 
Clock slack minimization( 最 小 时 钟 松弛 ),254,302 
Clock utilization( 时 钟 利 用 ),254 
Closeness function( 接 近 函 数 ),183 
Closeness metric( 接 近 度 量 ) ,183,223 
Clustering( 结 群 ) ,187,201,205,298 
Cluster tree( 结 群 树 ),189,206,209 
Communication( 通信 ), 77, 91, 92, 94, 100, 108, 150, 





250 


索 3 





152,290 
broadcast( 广 播 ) ,77,99, 103 
channel see Channel( 通 信和 通道 ) 
message-passing( 消 息 传 弟 ),78,82,97,108,152 
shared-memory ( 共享 存储 器 ) , 77,152 
Compiler optimizations( 编译 优化 ),295 
Completion( $282) , 75,88, 100, 101, 105, 109, 135 
Completion point(3¢ AQ. ),75,110, 123,128 
Complex-instruction-set computer( 复杂 指令 集 计 算 机 )， 
5] 
Component implementation( 4H fF 2E HL) , 381 , 383 
Component-connectivity diagram ( 48 F£ FA ) , 32 
Conceptual model( 概 念 模型 ), 15,64, 65,83, 108, 146 ~ 
148,164 
Conceptualization( 概念 化 ) ,6, 145 
Conceptualization environment, see Environment( 概念 化 
环境 ,参见 Environment) 
Concurrency( 并 发 ),6$,66,74 ,88 ,135 
bit-level( 位 级 并 发 ),66 
control-driven( 并 发 控制 设计 ),67 
data-driven( 数 据 驱动 并 发 ) ,66 
job-level( 作 业 级 并 发 ) ,66 
operation-level( 操 作 级 并 发 ),66 
statement-level (1 FJ RIF E ) ,66,69,89,94,159 
task-level (£ FRH K ) ,66,89,94, 160 
Constraints( 24) # ) ,233 
Control access refinement( 控 制 访 问 细 化 ) , 356 , 366 
Control steps( 控制 步 ) ,241,260 
Control systems( 控 制 系统 ),21 
Control unit( 控 制 单元 ),249,284 
Control-flow graph( 控 制 流 图 ) ,31 
Control/data flow graph( 控 制 /数据 流 图 ),36,178,205， 
210,219, 389 
Controller (42 iil #8 ) ,47 
Controller architecture( 控 制 器 体系 结构 ),47 
Cosimnulation( BHEIR HA) ,219 
Cost( 成 本 ),182 
Cosyma( 一 种 系统 设计 系统 ),221 
CSP( 通 信和 顺序 进程 语言 ),82,84,96 
Cutline( 切割 线 ) ,190 
D 
Data access refinement( 数 据 访 问 细 化 ) , 356 , 363 
Database( 数 据 库 ),385 ,392,397 
Dataflow( 数 据 流 ),66,91,92,100,102,156,178,375 
Dataflow graph( 数 据 流 图 ),29 
Datapath( 数 据 通 路 ) ,48,249,275 ,299 


bit-sliced stack( 位 片 堆 栈 ),282 
Datapath architecture( 数 据 通 路 体系 结构 ),48 
Decomposition, see Hierarchy( 分 解 , 参 见 Hierarchy) 
Delta time(8 时 间 ) , 167 
Describe-and-synthesize( 描述 ~ Sr ),7~ 10,384,386 
Design domain( 设 计 域 ) ,17 
Design model( 设 计 模 型 ) ,234 ,237,249 
Design process( 设 计 过 程 ),1,2,6,13,17,19,60 
Design representation( 设 计 表 示 ),1,2 
behavioral( 行 为 ),2 一 4 
physical ( 物理 ),3,4 
structural( 结 构 ),3,4 
Design time( 设 计时 间 ) ,248 
Design view( 设 计 观 点 ),401 
DFG( Dataflow graph) (数据 流 图 ),29 
E 
Embedded system(#k At AE) ,13,86,104, 108,133 
Entity-relationship diagram( 实 体 关 系 图 ) , 34 
Environment( 环 境 ) , 385, 386 , 397 
ERD(Entity-relationship diagram) (实体 关系 图 ),34 
Esterel( 一 种 系统 设计 系统 ),103 
Estimation( 评 估 ),12,180,233,380,387,399 
accuracy( 评 估 精 度 ),235 
fidelity( 评 估 保 真 度 ),181 ,236 
hardware( 硬 件 评估 ),249,302 
software( 软 件 评估 ) ,290 ,303 
Event graph( 事 件 图 ),350 
Exceptions( 异 常 ,例外 ),83,88,92,93,103,108,127， 
135,161,164 
Executable specification, see Specification, executable ( 可 
执行 描述 ,参见 Specification, executable) 
Fxecution frequency( 执 行 频率 ),269,270 
Execution time( 执 行 时间 ),242,268,273,295 ,299 
Exploration{( 探 索 ) ,11 一 13 


F 
Finitestate machine( 有 限 状态 机 ),20, 65, 72, 86, 97, 
99,100,110,162 
hierarchicai( 层次 式 有 限 状 态 机 ) ,15S0 
state-based( 基 于 状态 的 有 限 状态 机 ) ,22 
transition-based( 基 于 状态 迁移 的 有 限 状态 机 ) ,22 
Finite-state machine with datapath( 带 数据 通路 有 限 状 态 
机 ),23,50 
Flow analysis( 流 程 分 析 ),269,273,303 
Flow chart( 流 程 图 ),31 
Fork-join( 4 X 一 连接 ),68,81,92,103,112,159,164 
FPGA( 现 场 可 编程 门 阵列 ),395 
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FSM(Finite-state machine)( 有 限 状 态 机 ) , 20 
FSMD( Finite-state machine with datapath)( 带 数据 通路 
有 限 状 态 机 ) ,23,50,178,249 
Functional erroers( 功 能 错误 ) , 132, 133, 136 
Functional objects( 功 能 对 象 ) ,309,381 
G 
Gate-level component( 门 级 元 件 ),5,9 
Gate-level schematic( 门 级 原理 图 ),32 
Genetic evolution( 遗传 进化 ) ,198 
Greedy algorithm( 贪 心算 法 ),184,214 
Group migration( 成 组 移植 ) ,191 
H 
Hardware( WP {F ), 12,354 
Hardware behavior( 人 硬件 行为 ),357 
Hardware component( 人 硬件 组 件 ),355 
Hardware description language( 人 硬件 找 述 语言 ),63,65， 
88 
Hardware partition( 硬件 划分 ) , 356 
Hardware pert( 硬件 端口 ) , 357 
Hardware variable( 硬件 变量 ) , 357 
Hardware/software partition, see Partitioning, hardware/ 
soft( 软 硬件 划分 ,参见 Partitioning, hardware/soft ) 
HardwareC, 69,93 
HCFSM( 层 次 并 发 有 限 状态 机 ),27 
Hierarchical concurrent finite-state machine (层次 并 发 有 
限 状态 机 ),27 
Hierarchy( 层 次 ) ,70,134,135,150,158 
behavioral (层次 式 行为 ),72,74,76,87,89, 92, 96, 
98,101,103,104,121,165 
concurrent decomposition( 并 发 分 解 ),74,98,104,126 
sequential decomposition (顺序 分 解 ), 72, 98, 104, 
121 ~ 123,127, 128,134 
structural 层次 式 结构 ),71,89,92 ,93,100,103, 108, 
158 
High-level synthesis, see Synthesis, chip( 高 层次 综合 , 参 
W, Synthesis, chip) 
Hill-climbing algorithm (EHA), 184,216 
History (JI #),99 
I 
Integer linear programming( 整 数 线性 规划 ) , 200,225 
Interactive television (46 H.A E #2) ,375 
Interface( 接口 ) , 121,393 
incompatibility( 不 相 容 接口 , 336, 337 
process generation( 接 口 进程 生成 ),342,345,349 
refinement( 接 口 细 化 ),313 
Interface generation( 接 口 生成 ),356,361,362 
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Intermediate forms( 中 间 格 式 ),386 


Jackson’ s diagram(Jackson 图 ) ,35 


K 
Kernighan /Lin(Kernighan/Lin) , 191 
L 
Language(iB & ) 
application-specific( 专 用 语言 ),147 
front-end( 前 端 语 言 ),147 
standard( 标 准 语 言 ),145 一 147 
Left-edge algorithm( 左 边 算法 ),278 
Local minimum( 局 部 最 小 ),184 
Logic minimization( 逻辑 最 小 化 ),7,393 
M 
Manual design( 手 工 设 计 ),140,386,402,403 
Manufacturing cost( 制 造成 本 ),248 
Memory address translation( 存 储 器 地 址 翻译 ) ,312 
Message passing, see Communication, message-passing ( 信 
息 .传递 ,参见 Communication, message-passing) 
Methodology( 方 法 学 ),6,7,10,11,13,373 
Metric, see Quality metric( 度量 ， 参见 Quality metric) 
Min-cut( fi //\ 2) , 191 
Model ( #2 #!) ,16~ 19 
activity-oriented( 面 向 活动 的 模型 ) ,19,29,31 
data-oriented( 面 向 数据 的 模型 ) 20, 34, 35 
Heterogencous( $# fA EW ) ,20, 36,39,40,42,43 
state-oriented (AIA RAS AY BRAY) , 19,20, 24,27 
structure-oriented( 面 向 结构 的 模型 , 20,32 
tightly-integrated( 紧密 集成 的 模型 ) ,20 
Multi-stage clustering( #245 # ) , 190,210,300 


N 
Natural language, see specification, natural-language( 自然 


语言 ,参见 Specification, natural-language ) 
Non-determinism( 非 确定 性 ),83,97 
O 
Object-oriented model( 面 向 对 象 的 模型 ) ,42 
Objective function( 目标 函数 ) ,182,212,220,223 
Operator-use method( 运 算 符 -使 用 方法 ),260 
P 
Partitioning( 划 分 ),12,171,246,382,387 
abstraction level( 抽 象 级 别 划分 ),177 
algorithms( 划 分 算法 ),183 ,186 ,228 
granularity( 划 分 粒度 ),179,223 
hardware/software( 软 硬件 划分 ),174,175,214,221 
output( 划 分 输出 ),184 
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structural vs. functional (2445 BERIA), 172 
Performance( 性 能 ) , 240 , 300 , 302 
Petri net(Petri 网 ) ,24 
Physical design( 物 理 设计 ) ,395 
Pins( 引 脚 ) ,239,288 ,303 
Pipelining( 流 水 线 ),243,251 ,262 
latency( 时 延 ) ,243 
throughput ( FHE ) ,243 
Power( JH ) 247, 305 
Processor-level component (ARMAR 2 4A ) 5 
Program state machines (程序 状态 机 ), 43, 65, 70, 75, 
83,104,121,133,136,164 
Programming constructs (FE FF #378 ), 74, 88,90, 92,94, 
96,103, 134,139 
Programming language paradigm( 程 序 语言 模式 ),40 
Protocol( 协 议 ),273,314,326,327,336,338,342 
delay( 时 延 ) ,314,324 
generation( 协 议 生 成 ),315,326,329 
Protocol converter( 协 议 转 换 器 ),353 
PSM(Program-state machine) (程序 状态 机 ),43 


Q 
Quality metric, see Estimation (质量 度量 ,参见 Estima- 
tion) ,180,223,233,238,400,403 
Queue( 队 列 ),155,159 
Queueing model( 排 队 模 型 ) , 45 
R 
Ratio cut( 比例 切割 ),194 
Reduced-instruction-set computer( 精简 指令 集 计 算 机 )， 
53 
Refinement( 41% ) , 12, 13,309, 382 
channel groups( iH IÑ 44 ) , 313 
variable groups( 4 4H ) , 3.10 
Register-level component( 寄 存 右 级 元 件 ),5,8,9 
Register-level schematic( 寄 存 器 级 原理 网 ) ,32 
Regularity( 规则) ,228 


RISC(Reduced-instruction-set computer ) (精简 指令 集 计 


算 机 ),53 
S 
Scheduling( 调 度 ),8,264,389 
force-directed( 力 指向 调度 ),279 
Scoping (78 FA) , 165 
SDL( 规 范 与 描述 语言 ),100 
Send /receive( 发 送 /接收 ) ,78 ,327 
blocking( 阻 塞 式 发 送 /接收 ),79,152 
nonblocking( 非 阻塞 式 发 送 接收 ),79,154 
Sequential statements( 顺序 语句 ) ,128 





Shared port( 共 享 端口 ),3537 

Shared variable( 共 享 变 量 , 357 

SIERA( 一 种 系统 设计 环境 ) , 353 

Silagc( 一 种 数字 信和 号 处 理 系 统 的 描述 语言 ),101 

Simulated annealing( 模 拟 退 火 ) , 196 

Simulation( 模拟) , 133,381,386 

Software( 软 件 ) , 11,354 

Software behavior( 软 件 行为 ),357 

Software component( 软 件 组 件 ),355 

Software partition( 软件 划 分 ),356 

Software port( 软件 端口 ),357 

Software size( 软 件 大 小 ),239,296,297 

Software variable( 软件 变量 ),357 

SpecCharts(SpecCharts 语言 ),104,121,133,136 一 138， 
140, 164,165,302 

Specification( 系 统 描述 ,规范 ) ,6,10,13,15 
executable( 可 执行 系统 摘 述 ),5,10,11,64,132,133， 
140,145,176,381 
natural-language (自然 语言 系统 描述 ), 15,64, 132, 
134,140,175,379 

Specification Refinement, see Refinement ( 系统 描述 细 化 ， 
参见 Refinement) 

Specify-explore-refine( 描 述 - FRA — 细 化 ) ,13 

SpecSyn( 一 种 系统 设计 描述 语言 ),222,302 

State encoding( 状 态 编 码 ),393 

State minimization( 状 态 最 小 化 ),7,393 

State transition, see Transition (状态 迁移 ,参见 Transi- 
tion ) 

Statecharts( 一 种 状态 图 描述 语言 ),65,81,83,97,138， 
139 

Structural decomposition, see Hierarchy, structural (结构 
分 解 , & 5, Hierarchy, structural) 

Structure chart( 结 构图 ) ,39 

Synchronization( 同 步 ),80,91,92,95,99,101,104,107 

Synthesis( 综 合 ),384,402 
arbiter( 仲裁 器 ) ,387 
behavioral( 行 为 综合 ),7,9 
chip( 心 片 综合 ) ,168,385,389 
high-levei( 高 层次 综合 ) ,7 
interface( 接 口 综合 ),387,394 
logic( 人 逻辑 综合 ),6,7,9,385,393 
memory( 存 储 髓 综合 ),394 
software( 软件 综合 ),385,395 
system( 系统 综合 ) ,385 ,387 

System component( 系 统 组 件 ) ,171,180,223,309 

System design( 系统 设计 ),15,380 一 382 
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System functionality ( 系统 功 能 ), 1 ~ 3,10, 15, 16, 18, 
64,133,140, 145,377,379, 381 

System implementation( 系统 实现 ),2,18 

System specification, see Specification (系统 描述 ,参见 
Specification) 

T 

Technology mapping( 工 艺 映 射 ) ,7 

Testability( 可 测试 性 ) ,247 

Testbench ( 测试 用例) , 129 

Time shift( BY lB] HER ) , 167 

Time to market( 上 市 时 间 ) ,248 

Timeout( 超 时 ) ,84,91,99,107,108 

Timing( 时 序 ,时 延 ),84,93,101 
constraints( Ff 4E2938 ) ,85,95,246, 340 
functional( 功 能 时 序 ) ,84,91,99, 102, 108, 162 

Tradeoffs( 折 中 ),225 

Transduce synthesis( 转换 器 综合 ),350 

Transformation 变换 ) ,387 

Transistor-level component ( 晶体 管 级 元 件 ) , 4 

Transition( 迁 移 , 转 换 ),69,73,86,97, 99 ~ 101, 105, 
107,110,123,134,149, 164 
Immediately( TI) (BBETIE ® ),107,110,125,128,135 
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on completion (TOC) (xf #% 5é A), 75, 105, 110, 123, 
124 
Translation( 翻译 ) ,147 
U 
Uninterpreted operations( 非 解释 的 操作 ) ,158 
User interface( 用 户 接 口 ) , 399 
V 
Variable distribution 变量 分 配 ) , 356,357 
Variable folding% ĦA ), 310 
Variable Hfetime( 变 量 生存 期 ) ,275,299 ,302 
Vector machine( 问 量 机 ) , 55 
Verification( 验 证 ) ,64 
Verilog ,92 
Vervlong-instruction-word computer( 超 长 指令 宁 计 算 
机 ),56 
VHDL( 一 种 程序 设计 语言 ), 84, 88, 105, 109, 112, 
136~138,149,162,164,165,302,386 
VLIW( Very-long-instruction-word computer)( 超 长 指令 
字 计 算 机 ),56 
Vulcan( 一 种 系统 划分 工具 ),219,301 
Y 
Yorktown silicon compiler(— #f HE 4a iE F ) , 201 


